Capa de salida (Output Layer)

Definición breve

La capa de salida es la última capa de una red neuronal, encargada de producir la predicción final del modelo en función de las transformaciones realizadas por las capas anteriores.

Explicación del concepto

La capa de salida convierte las representaciones internas del modelo en un resultado interpretable.

Dependiendo del problema, la salida puede ser:

  • una clase (clasificación)
  • un valor numérico (regresión)
  • una probabilidad
  • una secuencia (en modelos de lenguaje)

Esta capa está diseñada específicamente según el tipo de tarea.

Cómo funciona

La capa de salida realiza:

  1. Recepción de la última capa oculta
  2. Transformación lineal (pesos y sesgo)
  3. Aplicación de una función de activación (según el problema)

Representación conceptual

y=ϕ(Wh+b)y = \phi(Wh + b)y=ϕ(Wh+b)

Donde:

  • hhh es la salida de la última capa oculta
  • WWW son los pesos
  • bbb es el sesgo
  • ϕ\phiϕ es la función de activación
  • yyy es la predicción final

Tipos de salida según la tarea

1. Clasificación binaria

  • función: sigmoide
  • salida: probabilidad entre 0 y 1

2. Clasificación multiclase

  • función: softmax
  • salida: distribución de probabilidades

3. Regresión

  • función: lineal (sin activación)
  • salida: valor continuo

4. Modelos de lenguaje

  • salida: distribución sobre tokens

Características principales

  • depende del tipo de problema
  • contiene parámetros entrenables
  • define el formato de la predicción
  • trabaja junto a la función de pérdida

Por qué es importante

  • determina cómo se interpreta el resultado
  • afecta directamente la precisión
  • conecta con la función de pérdida
  • define el objetivo del modelo

Ejemplo conceptual

Un modelo de clasificación de imágenes:

  • entrada: imagen
  • salida: probabilidades de cada clase

Ejemplo en PyTorch

import torch.nn as nn
model = nn.Sequential(
nn.Linear(10, 3), # 3 clases
nn.Softmax(dim=1)
)

Conceptos relacionados

Resumen

La capa de salida es la responsable de generar la predicción final de una red neuronal. Su diseño depende del tipo de tarea y es clave para traducir el aprendizaje interno del modelo en resultados útiles e interpretables.