Lexicon Redes Neuronales

Redes siamesas

Definición breve

Las redes siamesas son una arquitectura de redes neuronales que utilizan dos o más subredes idénticas para comparar entradas y medir su similitud.

Explicación del concepto

Las redes siamesas están diseñadas para aprender si dos entradas son similares o diferentes.

Cada subred:

tiene la misma estructura
comparte los mismos pesos

Esto garantiza que ambas entradas se procesen de la misma manera.

En lugar de predecir una clase directamente, el modelo aprende una función de distancia o similitud entre representaciones.

Cómo funciona

El proceso incluye:

Entrada doble
Se reciben dos elementos (por ejemplo, dos imágenes).
Procesamiento paralelo
Ambas entradas pasan por redes idénticas.
Obtención de embeddings
Se generan representaciones vectoriales.
Cálculo de similitud
Se mide la distancia entre los vectores.

Fórmula conceptual

$d(x_1, x_2) = \| f(x_1) – f(x_2) \|$ d(x1,x2)=∥f(x1)−f(x2)∥

Donde:

$f(x)$ f(x) es la representación aprendida
$d$ d es la distancia entre ambas entradas

Características principales

subredes con pesos compartidos
aprendizaje basado en similitud
uso de embeddings
entrenamiento con pares de datos

Aplicaciones

reconocimiento facial
verificación de identidad
búsqueda de similitud
detección de duplicados
sistemas de recomendación

Por qué es importante

Las redes siamesas permiten resolver problemas donde:

no hay muchas clases definidas
se necesita comparar elementos
los datos son limitados

Son especialmente útiles en escenarios de aprendizaje con pocos ejemplos.

Ejemplo conceptual

Un sistema compara dos rostros para determinar si pertenecen a la misma persona.

Ejemplo en PyTorch

Estructura simplificada:

			
output1 = model(input1)
output2 = model(input2)
distance = (output1 - output2).pow(2).sum()

Conceptos relacionados

Resumen

Las redes siamesas son arquitecturas diseñadas para medir similitud entre entradas mediante redes con pesos compartidos. Son fundamentales en tareas de comparación, verificación y aprendizaje con pocos datos, y desempeñan un papel clave en aplicaciones modernas de inteligencia artificial.