Preentrenamiento

Definición breve

El preentrenamiento es el proceso de entrenar un modelo en grandes conjuntos de datos antes de adaptarlo a tareas específicas.

Explicación del concepto

Los modelos aprenden patrones generales del lenguaje durante el preentrenamiento.

Cómo funciona

Se utilizan tareas como:

  • predicción del siguiente token
  • masked language modeling

Por qué es importante

El preentrenamiento permite reutilizar modelos para múltiples tareas.

Ejemplo conceptual

Un modelo entrenado en miles de millones de documentos aprende gramática y conocimiento general.

Ejemplo en Python

Python
model = AutoModelForCausalLM.from_pretrained("gpt2")

Conceptos relacionados

Resumen

El preentrenamiento permite construir modelos de lenguaje generales que luego pueden adaptarse a tareas específicas.