Exactitud

Definición breve

La exactitud (accuracy) es una métrica de evaluación que mide la proporción de predicciones correctas realizadas por un modelo sobre el total de predicciones.

Explicación del concepto

La exactitud es una de las métricas más simples y utilizadas en problemas de clasificación. Indica qué tan frecuentemente el modelo acierta en sus predicciones.

Se calcula comparando las predicciones del modelo con los valores reales y determinando el porcentaje de coincidencias.

Aunque es fácil de interpretar, la exactitud puede ser engañosa en datasets desbalanceados, donde una clase domina sobre las demás.

Cómo funciona

La exactitud se calcula como la proporción de predicciones correctas sobre el total de predicciones.

Accuracy = \frac{TP + TN}{TP + TN + FP + FN}

Donde:

  • TP (Verdaderos positivos)
  • TN (Verdaderos negativos)
  • FP (Falsos positivos)
  • FN (Falsos negativos)

El resultado varía entre 0 y 1:

  • 1 → todas las predicciones son correctas
  • 0 → ninguna predicción es correcta

Por qué es importante

La exactitud es útil para obtener una visión general del rendimiento del modelo.

Sus ventajas incluyen:

  • fácil interpretación
  • cálculo sencillo
  • útil en datasets balanceados

Sin embargo, debe utilizarse junto con otras métricas en casos donde las clases están desbalanceadas.

Ejemplo conceptual

Supongamos un modelo que clasifica 100 correos electrónicos.

Si el modelo acierta en 90 casos, la exactitud será del 90%.

Sin embargo, si el 95% de los correos no son spam, un modelo que siempre predice “no spam” podría tener alta exactitud sin ser útil.

Ejemplo en PyTorch

La exactitud puede calcularse comparando predicciones con etiquetas reales.

Python
correct = (predictions == labels).sum().item()
accuracy = correct / len(labels)
print("Accuracy:", accuracy)

Este valor representa la proporción de aciertos del modelo.

Conceptos relacionados

Resumen

La exactitud (accuracy) es una métrica básica que mide la proporción de predicciones correctas de un modelo. Aunque es útil como indicador general, debe complementarse con otras métricas para obtener una evaluación más completa, especialmente en datasets desbalanceados.