Bayes ingenuo gaussiano

Clasificación probabilística para variables continuas

Bayes ingenuo gaussiano es una variante de Bayes ingenuo diseñada para trabajar con variables continuas, asumiendo que cada característica sigue una distribución normal (gaussiana).

👉 Es uno de los clasificadores probabilísticos más simples y eficientes para datos numéricos.


Definición corta

Bayes ingenuo gaussiano modela cada característica mediante una distribución normal condicionada a la clase.


🧠 Intuición

El modelo responde:

👉 “¿Qué tan probable es observar estos valores numéricos dentro de cada clase?”


Datos numéricos ↓ Distribuciones gaussianas ↓ Probabilidades de clase

📐 Fundamento matemático

Parte de Bayes ingenuo:

P(CX)=P(XC)P(C)P(X)P(C\mid X)=\frac{P(X\mid C)P(C)}{P(X)}

P(A)P(A)

P(BA)P(B\mid A)

P(B¬A)P(B\mid \neg A)

P(AB)=P(BA)P(A)P(B)0.68,  P(B)0.25P(A\mid B)=\frac{P(B\mid A)P(A)}{P(B)}\approx 0.68,\; P(B)\approx 0.25P(A∣B)=P(B)P(B∣A)P(A)​≈0.68,P(B)≈0.25P(B)=0.25P(B|A)P(A)=0.17P(A|B)~0.68Posterior = useful evidence / total evidence


y asume independencia condicional:P(XC)=iP(xiC)P(X|C)=\prod_i P(x_i|C)P(X∣C)=i∏​P(xi​∣C)


🔹 Suposición gaussiana

Cada característica sigue:

P(xiC)=12πσC2e(xiμC)22σC2P(x_i\mid C)=\frac{1}{\sqrt{2\pi\sigma_C^2}}e^{-\frac{(x_i-\mu_C)^2}{2\sigma_C^2}}P(xi​∣C)=2πσC2​​1​e−2σC2​(xi​−μC​)2​


👉 donde:

  • μC\mu_CμC​: media de la clase
  • σC2\sigma_C^2σC2​: varianza de la clase

🧠 Idea clave

Cada clase modela:

  • centro (media)
  • dispersión (varianza)

para cada característica.


📊 Ejemplo conceptual

Clase A → distribución normal Clase B → distribución normal distinta

🔄 Proceso de clasificación

🔹 Paso 1

Calcular probabilidades gaussianas por característica.


🔹 Paso 2

Multiplicar probabilidades.


🔹 Paso 3

Elegir clase más probable.


📊 Ejemplo conceptual

Características ↓ Probabilidades gaussianas ↓ Posterior ↓ Predicción

🧠 Uso en machine learning

Bayes ingenuo gaussiano se usa en:

  • clasificación médica
  • detección de anomalías
  • datasets pequeños
  • modelos rápidos de referencia

📊 Ejemplo conceptual

Datos continuos ↓ Modelo gaussiano ↓ Clasificación

🧠 Ventajas

  • muy rápido
  • fácil de entrenar
  • funciona bien con pocos datos
  • interpretable

🧠 Desventajas

  • independencia rara vez real
  • asunción gaussiana puede fallar
  • limitado para relaciones complejas

🧠 Relación con distribución normal

El modelo depende fuertemente de:

  • media
  • varianza
  • campana gaussiana

📊 Ejemplo conceptual

Distribución normal ↓ Probabilidad de pertenecer a clase

🧠 Comparación con otras variantes

VarianteTipo de datos
Gaussianocontinuos
Multinomialconteos
Bernoullibinarios

📊 Ejemplo conceptual

Tipo de dato ↓ Elegir variante adecuada

📊 Ejemplo en Python

from sklearn.naive_bayes import GaussianNB
import numpy as np
X = np.array([
[1.0, 2.0],
[1.1, 1.9],
[4.0, 5.0],
[4.2, 5.1]
])
y = np.array([0, 0, 1, 1])
model = GaussianNB()
model.fit(X, y)
print(model.predict([[1.2, 2.1]]))

Ejemplo conceptual simplificado

# calcular media y varianza por clase
# estimar probabilidades gaussianas

🧠 Qué muestran estos ejemplos

  • clasificación probabilística
  • uso de gaussianas
  • modelado continuo

⚠️ Errores comunes

Usar datos muy no gaussianos

Puede degradar resultados.


Ignorar escalado de variables

Puede afectar desempeño.


Pensar que aprende relaciones complejas

Es un modelo simple.


📊 Ejemplo conceptual en ML

Datos continuos ↓ Distribuciones gaussianas ↓ Probabilidades ↓ Clase final

🧠 Interpretación profunda

Bayes ingenuo gaussiano refleja un principio clave:

👉 Muchas distribuciones reales pueden aproximarse mediante gaussianas simples

Combina:

  • probabilidad
  • estadística
  • inferencia bayesiana

para construir clasificadores rápidos y eficientes.

Conclusión

Bayes ingenuo gaussiano es una variante probabilística de Bayes ingenuo para variables continuas basadas en distribuciones normales.

👉 Sigue siendo una herramienta importante para clasificación rápida y simple.


Related Concepts