Exhaustividad

Definición breve

La exhaustividad (recall) es una métrica de evaluación que mide la proporción de casos positivos reales que el modelo identifica correctamente.

Explicación del concepto

En problemas de clasificación, especialmente cuando se detectan eventos importantes (como enfermedades o fraudes), no basta con que el modelo sea preciso; también es crucial que detecte la mayor cantidad posible de casos positivos reales.

La exhaustividad mide qué tan bien el modelo encuentra todos los ejemplos positivos dentro del dataset.

Un modelo con alta exhaustividad tiene pocos falsos negativos, lo que significa que rara vez omite casos importantes.

Cómo funciona

La exhaustividad se calcula como la proporción de verdaderos positivos sobre el total de casos positivos reales.

Recall = \frac{TP}{TP + FN}

Donde:

  • TP (Verdaderos positivos)
  • FN (Falsos negativos)

El valor del recall varía entre 0 y 1:

  • 1 → todos los casos positivos fueron detectados
  • 0 → ningún caso positivo fue detectado

Por qué es importante

La exhaustividad es fundamental en situaciones donde perder un caso positivo puede tener consecuencias graves.

Ejemplos:

  • diagnóstico médico
  • detección de fraudes
  • sistemas de seguridad

En estos casos, es preferible tener algunos falsos positivos antes que perder casos reales.

Ejemplo en PyTorch

La exhaustividad suele calcularse con herramientas externas.

from sklearn.metrics import recall_score
y_true = [1, 1, 0, 1]
y_pred = [1, 0, 0, 1]
recall = recall_score(y_true, y_pred)
print(recall)

Este valor indica la capacidad del modelo para detectar casos positivos.

Conceptos relacionados

Resumen

La exhaustividad (recall) mide la capacidad de un modelo para identificar correctamente todos los casos positivos. Es una métrica clave en problemas donde es importante no omitir eventos relevantes, y suele utilizarse junto con otras métricas para evaluar el rendimiento del modelo de forma completa.