Ajuste por Instrucciones

Definición breve

El instruction tuning es el proceso de entrenar modelos de lenguaje para seguir instrucciones en lenguaje natural.

Explicación del concepto

Los modelos base suelen predecir texto de forma general. El instruction tuning adapta estos modelos para responder a instrucciones humanas específicas.

Cómo funciona

El modelo se entrena utilizando pares de datos:

  • instrucción
  • respuesta esperada

Por qué es importante

El instruction tuning permite que los modelos interactúen de forma más útil con los usuarios.

Ejemplo conceptual

Instrucción:

«Resume el siguiente texto en tres frases.»

El modelo aprende a producir un resumen.

Ejemplo en Python

instruction = "Resume el siguiente texto:"

Conceptos relacionados

Resumen

El instruction tuning permite que los modelos comprendan y ejecuten instrucciones humanas.