Bayes ingenuo multinomial

Clasificación probabilística basada en frecuencias y conteos

Bayes ingenuo multinomial es una variante de Bayes ingenuo diseñada para trabajar con datos de conteo, especialmente frecuencias de palabras en texto.

👉 Es uno de los algoritmos clásicos más importantes en procesamiento de lenguaje natural (NLP).


Definición corta

Bayes ingenuo multinomial modela la frecuencia de aparición de características dentro de cada clase.


🧠 Intuición

El modelo responde:

👉 “¿Qué tan probable es observar estas frecuencias de palabras en cada categoría?”


Texto ↓ Conteos de palabras ↓ Probabilidades ↓ Clasificación

📐 Fundamento matemático

Parte de Bayes ingenuo:

P(CX)=P(XC)P(C)P(X)P(C\mid X)=\frac{P(X\mid C)P(C)}{P(X)}

P(A)P(A)

P(BA)P(B\mid A)

P(B¬A)P(B\mid \neg A)

P(AB)=P(BA)P(A)P(B)0.68,  P(B)0.25P(A\mid B)=\frac{P(B\mid A)P(A)}{P(B)}\approx 0.68,\; P(B)\approx 0.25

Posterior = useful evidence / total evidence


y asume independencia condicional:P(XC)=iP(xiC)P(X|C)=\prod_i P(x_i|C)


🔹 Idea multinomial

Cada característica representa:

  • frecuencia
  • número de ocurrencias

👉 no solo presencia o ausencia.


📐 Modelo multinomial

P(XC)=iP(xiC)niP(X\mid C)=\prod_i P(x_i\mid C)^{n_i}


👉 donde:

  • nin_i​: frecuencia de la característica
  • P(xiC)P(x_i|C): probabilidad de esa característica en la clase

🧠 Idea clave

Palabras frecuentes dentro de una clase:

👉 aumentan la probabilidad de pertenencia a esa clase.


📊 Ejemplo conceptual

“gratis” aparece muchas veces ↓ Mayor probabilidad de spam

🔄 Proceso de clasificación

🔹 Paso 1

Contar palabras o características.


🔹 Paso 2

Calcular probabilidades por clase.


🔹 Paso 3

Elegir la clase más probable.


📊 Ejemplo conceptual

Conteos ↓ Probabilidades multinomiales ↓ Posterior ↓ Predicción

🧠 Diferencia con Bayes Bernoulli

VarianteQué modela
Bernoullipresencia/ausencia
Multinomialfrecuencia

📊 Ejemplo conceptual

Bernoulli → palabra existe Multinomial → cuántas veces aparece

🧠 Uso en machine learning

Bayes ingenuo multinomial se usa en:

  • filtrado de spam
  • clasificación de documentos
  • análisis de sentimiento
  • NLP clásico

📊 Ejemplo conceptual

Documento ↓ Frecuencia de palabras ↓ Clasificación

🧠 Relación con Bag of Words

Muy utilizado junto con:

  • Bag of Words
  • TF-IDF

👉 porque trabajan con frecuencias.


📊 Ejemplo conceptual

Texto ↓ Vector de conteos ↓ Bayes multinomial

🧠 Ventajas

  • rápido
  • eficiente
  • excelente en NLP clásico
  • funciona bien con alta dimensionalidad

🧠 Desventajas

  • independencia rara vez real
  • ignora orden de palabras
  • limitado para semántica compleja

🧠 Suavizado de Laplace

Evita probabilidades cero:

P(xiC)=ni+αN+αdP(x_i\mid C)=\frac{n_i+\alpha}{N+\alpha d}P(xi​∣C)=N+αdni​+α​


👉 muy importante en NLP.


📊 Ejemplo conceptual

Palabra nunca vista ↓ No producir probabilidad cero

📊 Ejemplo en Python

from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import CountVectorizer
texts = [
"oferta gratis ahora",
"hola amigo",
"gratis oferta limitada"
]
labels = [1, 0, 1]
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(texts)
model = MultinomialNB()
model.fit(X, labels)
test = vectorizer.transform(["gratis ahora"])
print(model.predict(test))

Ejemplo conceptual simplificado

# usar conteos de palabras
# calcular probabilidades

🧠 Qué muestran estos ejemplos

  • clasificación probabilística
  • uso de frecuencias
  • NLP clásico

⚠️ Errores comunes

Usarlo con datos continuos

No es ideal.


Pensar que entiende semántica

Trabaja con frecuencias simples.


Ignorar suavizado

Puede generar probabilidades cero.


📊 Ejemplo conceptual en ML

Frecuencias ↓ Probabilidades ↓ Posterior ↓ Clase final

🧠 Interpretación profunda

Bayes ingenuo multinomial refleja un principio clave:

👉 La frecuencia de aparición de patrones puede contener información suficiente para clasificar correctamente

Combina:

  • teoría de probabilidad
  • conteo estadístico
  • inferencia bayesiana

para construir clasificadores rápidos y efectivos.

Conclusión

Bayes ingenuo multinomial es una variante probabilística especializada en frecuencias y conteos, especialmente útil en NLP y clasificación de texto.

👉 Sigue siendo uno de los modelos clásicos más importantes en procesamiento de lenguaje natural.


Related Concepts