Capa oculta (Hidden Layer)

Definición breve

La capa oculta es una capa intermedia dentro de una red neuronal que transforma los datos de entrada mediante pesos y funciones de activación para aprender representaciones complejas.

Explicación del concepto

Las capas ocultas son el núcleo del aprendizaje en una red neuronal.

A diferencia de la capa de entrada, estas capas:

  • aplican transformaciones matemáticas
  • aprenden patrones en los datos
  • permiten modelar relaciones no lineales

Se llaman “ocultas” porque sus valores no son directamente observables desde el exterior del modelo.

Cómo funciona

Cada neurona en una capa oculta realiza:

  1. Multiplicación de entradas por pesos
  2. Suma con un sesgo
  3. Aplicación de una función de activación

Representación conceptual

h=σ(Wx+b)h = \sigma(Wx + b)h=σ(Wx+b)

Donde:

  • xxx es la entrada
  • WWW son los pesos
  • bbb es el sesgo
  • σ\sigmaσ es la función de activación
  • hhh es la salida de la capa

Características principales

  • contienen parámetros entrenables
  • capturan patrones complejos
  • permiten aprendizaje profundo
  • pueden existir múltiples capas

Tipos de capas ocultas

1. Capas densas (fully connected)

Todas las neuronas están conectadas.


2. Capas convolucionales

Especializadas en datos espaciales (imágenes).


3. Capas recurrentes

Procesan secuencias.


4. Capas de atención

Usadas en modelos Transformer.

Por qué es importante

  • permite modelar relaciones no lineales
  • aumenta la capacidad del modelo
  • mejora la precisión
  • es clave en el aprendizaje profundo

Ejemplo conceptual

Una capa oculta puede detectar:

  • patrones en imágenes
  • relaciones entre variables
  • estructuras en texto

Ejemplo en PyTorch

 import torch.nn as nn

model = nn.Sequential(
    nn.Linear(3, 8),   # capa oculta
    nn.ReLU(),
    nn.Linear(8, 1)
)

Conceptos relacionados

Resumen

La capa oculta es donde ocurre el aprendizaje real en una red neuronal. A través de transformaciones y funciones de activación, permite que el modelo capture patrones complejos y genere representaciones útiles para la tarea final.