Aprendizaje auto-supervisado

Definición breve

El aprendizaje auto-supervisado es un enfoque en el que el modelo aprende a partir de los propios datos generando automáticamente sus etiquetas o señales de entrenamiento.

Explicación del concepto

El aprendizaje auto-supervisado se sitúa entre el aprendizaje supervisado y no supervisado.

En este enfoque:

  • no se necesitan etiquetas humanas explícitas
  • el modelo crea sus propios objetivos de aprendizaje
  • se aprovechan grandes cantidades de datos sin etiquetar

Por ejemplo, en modelos de lenguaje, el sistema puede aprender prediciendo palabras faltantes en una oración.

Cómo funciona

El proceso de aprendizaje auto-supervisado incluye:

  1. Datos sin etiquetar
    Se utiliza un gran conjunto de datos sin anotaciones.
  2. Generación de tareas
    Se crean tareas artificiales (pretext tasks).
  3. Entrenamiento del modelo
    El modelo aprende a resolver estas tareas.
  4. Aprendizaje de representaciones
    Se obtienen representaciones útiles para otras tareas.

Este conocimiento puede reutilizarse posteriormente.

Ejemplos de tareas auto-supervisadas

  • predicción de palabras faltantes
  • predicción del siguiente elemento en una secuencia
  • reconstrucción de datos
  • contraste entre ejemplos positivos y negativos

Por qué es importante

El aprendizaje auto-supervisado es clave en la inteligencia artificial moderna.

Beneficios:

  • reduce la necesidad de datos etiquetados
  • permite aprovechar grandes datasets
  • mejora la generalización
  • es la base del preentrenamiento de modelos

Ejemplo conceptual

Un modelo de lenguaje aprende eliminando palabras de una frase y tratando de predecirlas.

Ejemplo en PyTorch

Un ejemplo simplificado de predicción de secuencia:

outputs = model(inputs)
loss = loss_function(outputs, targets

Aquí, los targets pueden generarse automáticamente a partir de los datos.

Conceptos relacionados

Resumen

El aprendizaje auto-supervisado permite a los modelos aprender a partir de datos sin etiquetar generando sus propias señales de entrenamiento. Es una técnica fundamental en la inteligencia artificial moderna y la base de muchos modelos avanzados como los transformers y los grandes modelos de lenguaje.