Norma (L1, L2)

Midiendo la magnitud de vectores en redes neuronales

La norma es una medida matemática que indica el tamaño o longitud de un vector. En redes neuronales, las normas son fundamentales para regularización, cálculo de distancias, estabilidad numérica y análisis de modelos.

Las dos normas más importantes en deep learning son:

  • Norma L1
  • Norma L2 (norma euclidiana)

Definición corta

Una norma es una función que mide la magnitud de un vector.

Definición detallada

Dado un vector:x=[x1,x2,...,xn]x = [x_1, x_2, …, x_n]x=[x1​,x2​,…,xn​]

🔹 Norma L1

x1=x1+x2++xn||x||_1 = |x_1| + |x_2| + \cdots + |x_n|∣∣x∣∣1​=∣x1​∣+∣x2​∣+⋯+∣xn​∣

👉 Suma de valores absolutos.

🔹 Norma L2

x2=x12+x22++xn2||x||_2 = \sqrt{x_1^2 + x_2^2 + \cdots + x_n^2}∣∣x∣∣2​=x12​+x22​+⋯+xn2​​

👉 Distancia euclidiana (la más común).

Intuición

La norma mide qué tan grande es un vector.

Ejemplo:x=[3,4]x = [3, 4]

  • Norma L1 → 3+4=73 + 4 = 73+4=7
  • Norma L2 → 9+16=5\sqrt{9 + 16} = 59+16​=5

👉 La L2 representa la distancia real en el espacio.

Interpretación geométrica

Norma L2

Es la distancia desde el origen:

👉 Como medir la longitud de una flecha en el espacio.

Norma L1

Es la distancia “por ejes”:

👉 Como moverse en una cuadrícula (tipo Manhattan).

Comparación L1 vs L2

PropiedadNorma L1Norma L2
CálculoSuma absolutaRaíz cuadrada
SensibilidadMenos sensible a outliersMás sensible
EfectoSparsitySuavizado
GeometríaForma de diamanteForma circular

Normas en redes neuronales

🔹 1. Regularización

L1 (Lasso)

λw1\lambda ||w||_1λ∣∣w∣∣1​

👉 Promueve:

  • Pesos exactamente cero
  • Modelos más simples

L2 (Ridge)

λw22\lambda ||w||_2^2λ∣∣w∣∣22​

👉 Promueve:

  • Pesos pequeños
  • Estabilidad

🔹 2. Control de magnitud

Evita que los pesos crezcan demasiado.

🔹 3. Cálculo de distancias

Usado en:

  • KNN
  • Clustering
  • Embeddings

🔹 4. Normalización

Escalar vectores para estabilidad:xnorm=xxx_{norm} = \frac{x}{||x||}

Ejemplo paso a paso

x=[1,2,3]x = [1, -2, 3]

L1

x1=1+2+3=6||x||_1 = 1 + 2 + 3 = 6

L2

x2=1+4+9=143.74||x||_2 = \sqrt{1 + 4 + 9} = \sqrt{14} \approx 3.74

Relación con otros conceptos

  • Distancia
  • Regularización
  • Gradiente
  • Optimización
  • Espacio vectorial

Ejemplo en Python