Cuartiles

Dividiendo los datos en cuatro partes iguales

Los cuartiles son valores que dividen un conjunto de datos ordenados en cuatro partes iguales, cada una con el 25% de los datos.

👉 Son fundamentales para entender la distribución, dispersión y estructura de los datos.

Definición corta

Los cuartiles son puntos que separan los datos en cuatro segmentos con igual número de observaciones.

Definición matemática

Q1,  Q2,  Q3Q_1,\; Q_2,\; Q_3


Donde:

  • Q1Q_1Q1​: primer cuartil (25%)
  • Q2Q_2Q2​: segundo cuartil (50%) → mediana
  • Q3Q_3Q3​: tercer cuartil (75%)

Intuición

Los cuartiles responden:

👉 “¿Cómo se distribuyen los datos en partes iguales?”


Datos ordenados ↓ División en 4 partes ↓ Cuartiles

Ejemplo simple

Datos: [1, 2, 3, 4, 5, 6, 7, 8]Q1 = 2.5 Q2 = 4.5 Q3 = 6.5

Interpretación

  • 25% de los datos ≤ Q1Q_1Q1​
  • 50% ≤ Q2Q_2Q2​
  • 75% ≤ Q3Q_3Q3​

📊 Ejemplo conceptual

Q1 → límite inferior Q2 → centro Q3 → límite superior

🧠 Rango intercuartílico (IQR)

IQR=Q3Q1IQR = Q_3 – Q_1


👉 mide la dispersión central.


📊 Interpretación

IQR pequeño → datos concentrados IQR grande → datos dispersos

🧠 Detección de outliers

Regla común:Outliers<Q11.5IQRo>Q3+1.5IQR\text{Outliers} < Q_1 – 1.5 \cdot IQR \quad \text{o} \quad > Q_3 + 1.5 \cdot IQR


👉 método robusto para detectar valores extremos.


📊 Ejemplo conceptual

Datos ↓ Cuartiles ↓ IQR ↓ Outliers

🧠 Relación con percentiles

  • Q1=P25Q_1 = P_{25}Q1​=P25​
  • Q2=P50Q_2 = P_{50}Q2​=P50​
  • Q3=P75Q_3 = P_{75}Q3​=P75​

👉 los cuartiles son percentiles específicos.


🧠 Uso en machine learning

Los cuartiles se usan en:

  • análisis exploratorio
  • detección de outliers
  • normalización robusta
  • visualización (boxplots)

📊 Ejemplo conceptual

Datos ↓ Cuartiles ↓ Distribución entendida

📊 Ejemplo en Python

import numpy as np
data = np.array([1,2,3,4,5,6,7,8])
q1 = np.percentile(data, 25)
q2 = np.percentile(data, 50)
q3 = np.percentile(data, 75)
print(q1, q2, q3)

🧠 Qué muestra este ejemplo

  • división de datos
  • cálculo práctico
  • interpretación estructural

Errores comunes

No ordenar los datos

Es esencial.


Confundir cuartiles con valores fijos

Dependen del dataset.


Ignorar IQR

Clave para análisis de dispersión.


📊 Ejemplo conceptual en ML

Datos ↓ Cuartiles ↓ Análisis robusto ↓ Mejor modelado

🧠 Interpretación profunda

Los cuartiles reflejan un principio clave:

👉 Entender la distribución es tan importante como conocer el promedio

Permiten:

  • analizar dispersión
  • detectar outliers
  • comprender estructura de datos

Conclusión

Los cuartiles dividen los datos en cuatro partes iguales y son esenciales para analizar la distribución, dispersión y detectar outliers.

👉 Son una herramienta clave en análisis de datos y machine learning.

Related Concepts

  • Mediana
  • Percentiles
  • IQR
  • Outliers
  • Distribución