Lexicon Redes Neuronales

Recorte de gradientes

Definición breve

El recorte de gradientes es una técnica utilizada durante el entrenamiento de modelos para limitar el tamaño de los gradientes y evitar inestabilidades en el aprendizaje.

Explicación del concepto

Durante el entrenamiento de redes neuronales, especialmente en modelos profundos o recurrentes, los gradientes pueden volverse excesivamente grandes.

Esto provoca:

actualizaciones de pesos demasiado grandes
inestabilidad en el entrenamiento
divergencia del modelo

El recorte de gradientes soluciona este problema limitando el valor máximo que pueden tomar los gradientes.

Cómo funciona

El proceso incluye:

Calcular los gradientes normalmente.
Evaluar su magnitud.
Reducirlos si superan un umbral definido.
Aplicar la actualización con gradientes ajustados.

Esto mantiene el entrenamiento bajo control.

Tipos de recorte de gradientes

1. Recorte por valor (Value Clipping)

Limita cada componente del gradiente a un rango fijo.

2. Recorte por norma (Norm Clipping)

Escala todo el vector de gradientes si su norma supera un umbral.

Fórmula conceptual

$g’ = g \cdot \min\left(1, \frac{\tau}{\|g\|}\right)$

Donde:

$g$ g es el gradiente original
$\\|g\\|$ ∣g∣ es su norma
$\\tau$ tau es el umbral máximo

Por qué es importante

El recorte de gradientes mejora la estabilidad del entrenamiento.

Beneficios:

evita gradientes explosivos
estabiliza redes profundas
mejora la convergencia
permite entrenar modelos más complejos

Ejemplo conceptual

Si un gradiente es demasiado grande, el modelo lo reduce antes de actualizar los pesos, evitando cambios bruscos.

Ejemplo en PyTorch

Aplicar recorte de gradientes:

			
import torch.nn.utils as utils
utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

Conceptos relacionados

Resumen

El recorte de gradientes es una técnica esencial para controlar la magnitud de los gradientes durante el entrenamiento. Permite estabilizar el aprendizaje, evitar divergencias y mejorar el rendimiento de modelos complejos en inteligencia artificial.