Clasificación binaria

Decidiendo entre dos posibles clases

La clasificación binaria es un problema de machine learning donde el modelo debe elegir entre dos categorías posibles.

👉 Es una de las tareas más fundamentales y comunes en inteligencia artificial.


Definición corta

La clasificación binaria asigna una observación a una de dos clases posibles.

clasificacion binaria
clasificacion binaria

🧠 Intuición

La clasificación binaria responde:

👉 “¿Pertenece este ejemplo a la clase positiva o negativa?”


Entrada ↓ Dos opciones posibles ↓ Predicción

📊 Ejemplo simple

Filtro de spam:

Spam → 1 No spam → 0

Otros ejemplos:

  • fraude / no fraude
  • enfermo / sano
  • aprobado / rechazado

🔄 Representación típica

Las clases suelen representarse como:y{0,1}y \in \{0,1\}


👉 problema binario.


🧠 Salida probabilística

Muchos modelos producen:P(y=1x)P(y=1|x)


👉 probabilidad de clase positiva.


📐 Función Sigmoid

La clasificación binaria usa frecuentemente:

σ(z)=11+ez\sigma(z)=\frac{1}{1+e^{-z}}


👉 transforma logits en probabilidades.


📊 Ejemplo conceptual

Logit ↓ Sigmoid ↓ Probabilidad entre 0 y 1

🧠 Regla de decisión

Usualmente:

P ≥ 0.5 → clase positiva P < 0.5 → clase negativa

👉 aunque el umbral puede cambiar.


🧠 Función de pérdida típica

Se utiliza normalmente:

🔹 Entropía cruzada binaria

L=[ylog(p)+(1y)log(1p)]L=-[y\log(p)+(1-y)\log(1-p)]


👉 penaliza predicciones incorrectas.


🧠 Uso en machine learning

La clasificación binaria se usa en:

  • detección de spam
  • diagnóstico médico
  • análisis financiero
  • sistemas de riesgo

📊 Ejemplo conceptual

Datos ↓ Modelo ↓ Probabilidad ↓ Clase final

🧠 Modelos comunes

  • regresión logística
  • redes neuronales
  • árboles de decisión
  • SVM

📊 Ejemplo conceptual

Entrada ↓ Modelo ↓ Predicción binaria

🧠 Métricas importantes

  • accuracy
  • precision
  • recall
  • F1-score
  • ROC-AUC

📊 Ejemplo conceptual

Predicciones ↓ Comparación con realidad ↓ Evaluación

📊 Ejemplo en Python

Python
from sklearn.linear_model import LogisticRegression
import numpy as np
X = np.array([[1], [2], [3], [4]])
y = np.array([0, 0, 1, 1])
model = LogisticRegression()
model.fit(X, y)
print(model.predict([[2.5]]))

Ejemplo en PyTorch

Python
import torch
import torch.nn as nn
model = nn.Sequential(
nn.Linear(1, 1),
nn.Sigmoid()
)
x = torch.tensor([[2.0]])
print(model(x))

🧠 Qué muestran estos ejemplos

  • clasificación entre dos clases
  • salida probabilística
  • decisión binaria

⚠️ Errores comunes

Usar accuracy en datasets desbalanceados

Puede ser engañoso.


Elegir mal el umbral

Afecta precision y recall.


Confundir logits con probabilidades

No son lo mismo.


📊 Ejemplo conceptual en ML

Entrada ↓ Probabilidad ↓ Sí o no

🧠 Interpretación profunda

La clasificación binaria refleja un principio clave:

👉 Muchos problemas reales pueden formularse como decisiones entre dos posibilidades

Es la base de:

  • regresión logística
  • detección automática
  • clasificación probabilística

Conclusión

La clasificación binaria permite decidir entre dos clases posibles y es uno de los problemas más importantes del machine learning.

👉 Constituye la base de numerosos sistemas de predicción modernos.

Related Concepts

Ejemplo en Python

Este concepto incluye un ejemplo práctico en Python para ayudarte a entenderlo mejor:

👉 Ver código en GitHub