Definición breve
El subajuste (underfitting) ocurre cuando un modelo de aprendizaje automático es demasiado simple para capturar los patrones importantes en los datos, lo que resulta en un rendimiento pobre tanto en el conjunto de entrenamiento como en datos nuevos.
Explicación del concepto
En el entrenamiento de modelos de aprendizaje automático, el objetivo es encontrar un equilibrio entre ajustar bien los datos de entrenamiento y generalizar correctamente a nuevos datos.
El subajuste ocurre cuando el modelo no logra aprender los patrones fundamentales del conjunto de datos. Esto puede suceder cuando el modelo es demasiado simple o cuando el entrenamiento no es suficiente para que el modelo aprenda relaciones significativas.
Como resultado, el modelo produce predicciones imprecisas incluso en los datos que utilizó para entrenarse.
Cómo funciona
El subajuste suele aparecer cuando:
- el modelo tiene una arquitectura demasiado simple
- el número de parámetros del modelo es insuficiente
- el entrenamiento se detiene demasiado pronto
- las características utilizadas no capturan información relevante
En estos casos, el modelo no puede representar la complejidad del problema.
Por qué es importante
El subajuste indica que el modelo no está aprendiendo adecuadamente de los datos.
Para mejorar el rendimiento del modelo, puede ser necesario:
- aumentar la complejidad del modelo
- entrenar durante más iteraciones
- utilizar mejores representaciones de datos
- ajustar los hiperparámetros del modelo
Comprender el subajuste ayuda a diseñar modelos más efectivos.
Ejemplo conceptual
Supongamos que un modelo intenta predecir el precio de viviendas utilizando solo una variable simple, como el tamaño de la casa.
Si el precio depende de múltiples factores —ubicación, número de habitaciones, antigüedad— el modelo será demasiado simple para capturar estas relaciones y producirá predicciones poco precisas.
Ejemplo en PyTorch
El subajuste puede observarse cuando tanto la pérdida de entrenamiento como la pérdida de validación son altas.
train_loss = 0.60validation_loss = 0.65
En este caso, el modelo no ha aprendido suficientemente los patrones presentes en los datos.
Conceptos relacionados
- Sobreajuste
- Regularización
- Entrenamiento de Modelos
- Arquitectura del Modelo
- Hiperparámetros
Resumen
El subajuste ocurre cuando un modelo es demasiado simple o está insuficientemente entrenado para capturar los patrones presentes en los datos. Como resultado, el modelo muestra un rendimiento bajo tanto en el conjunto de entrenamiento como en nuevos datos. Identificar y corregir el subajuste es esencial para construir modelos de aprendizaje automático efectivos.