Definición breve
La capa oculta es una capa intermedia dentro de una red neuronal que transforma los datos de entrada mediante pesos y funciones de activación para aprender representaciones complejas.
Explicación del concepto
Las capas ocultas son el núcleo del aprendizaje en una red neuronal.
A diferencia de la capa de entrada, estas capas:
- aplican transformaciones matemáticas
- aprenden patrones en los datos
- permiten modelar relaciones no lineales
Se llaman “ocultas” porque sus valores no son directamente observables desde el exterior del modelo.
Cómo funciona
Cada neurona en una capa oculta realiza:
- Multiplicación de entradas por pesos
- Suma con un sesgo
- Aplicación de una función de activación
Representación conceptual
h=σ(Wx+b)
Donde:
- x es la entrada
- W son los pesos
- b es el sesgo
- σ es la función de activación
- h es la salida de la capa
Características principales
- contienen parámetros entrenables
- capturan patrones complejos
- permiten aprendizaje profundo
- pueden existir múltiples capas
Tipos de capas ocultas
1. Capas densas (fully connected)
Todas las neuronas están conectadas.
2. Capas convolucionales
Especializadas en datos espaciales (imágenes).
3. Capas recurrentes
Procesan secuencias.
4. Capas de atención
Usadas en modelos Transformer.
Por qué es importante
- permite modelar relaciones no lineales
- aumenta la capacidad del modelo
- mejora la precisión
- es clave en el aprendizaje profundo
Ejemplo conceptual
Una capa oculta puede detectar:
- patrones en imágenes
- relaciones entre variables
- estructuras en texto
Ejemplo en PyTorch
import torch.nn as nn
model = nn.Sequential(
nn.Linear(3, 8), # capa oculta
nn.ReLU(),
nn.Linear(8, 1)
)
Conceptos relacionados
Resumen
La capa oculta es donde ocurre el aprendizaje real en una red neuronal. A través de transformaciones y funciones de activación, permite que el modelo capture patrones complejos y genere representaciones útiles para la tarea final.