Definición breve
El instruction tuning es el proceso de entrenar modelos de lenguaje para seguir instrucciones en lenguaje natural.
Explicación del concepto
Los modelos base suelen predecir texto de forma general. El instruction tuning adapta estos modelos para responder a instrucciones humanas específicas.
Cómo funciona
El modelo se entrena utilizando pares de datos:
- instrucción
- respuesta esperada
Por qué es importante
El instruction tuning permite que los modelos interactúen de forma más útil con los usuarios.
Ejemplo conceptual
Instrucción:
«Resume el siguiente texto en tres frases.»
El modelo aprende a producir un resumen.
Ejemplo en Python
instruction = "Resume el siguiente texto:"
Conceptos relacionados
Resumen
El instruction tuning permite que los modelos comprendan y ejecuten instrucciones humanas.