Dividiendo los datos en cuatro partes iguales
Los cuartiles son valores que dividen un conjunto de datos ordenados en cuatro partes iguales, cada una con el 25% de los datos.
👉 Son fundamentales para entender la distribución, dispersión y estructura de los datos.
Definición corta
Los cuartiles son puntos que separan los datos en cuatro segmentos con igual número de observaciones.
Definición matemática
Donde:
- Q1: primer cuartil (25%)
- Q2: segundo cuartil (50%) → mediana
- Q3: tercer cuartil (75%)
Intuición
Los cuartiles responden:
👉 “¿Cómo se distribuyen los datos en partes iguales?”
Datos ordenados ↓ División en 4 partes ↓ Cuartiles
Ejemplo simple
Datos: [1, 2, 3, 4, 5, 6, 7, 8]Q1 = 2.5 Q2 = 4.5 Q3 = 6.5
Interpretación
- 25% de los datos ≤ Q1
- 50% ≤ Q2
- 75% ≤ Q3
📊 Ejemplo conceptual
Q1 → límite inferior Q2 → centro Q3 → límite superior
🧠 Rango intercuartílico (IQR)
👉 mide la dispersión central.
📊 Interpretación
IQR pequeño → datos concentrados IQR grande → datos dispersos
🧠 Detección de outliers
Regla común:
👉 método robusto para detectar valores extremos.
📊 Ejemplo conceptual
Datos ↓ Cuartiles ↓ IQR ↓ Outliers
🧠 Relación con percentiles
- Q1=P25
- Q2=P50
- Q3=P75
👉 los cuartiles son percentiles específicos.
🧠 Uso en machine learning
Los cuartiles se usan en:
- análisis exploratorio
- detección de outliers
- normalización robusta
- visualización (boxplots)
📊 Ejemplo conceptual
Datos ↓ Cuartiles ↓ Distribución entendida
📊 Ejemplo en Python
import numpy as npdata = np.array([1,2,3,4,5,6,7,8])q1 = np.percentile(data, 25)q2 = np.percentile(data, 50)q3 = np.percentile(data, 75)print(q1, q2, q3)
🧠 Qué muestra este ejemplo
- división de datos
- cálculo práctico
- interpretación estructural
Errores comunes
No ordenar los datos
Es esencial.
Confundir cuartiles con valores fijos
Dependen del dataset.
Ignorar IQR
Clave para análisis de dispersión.
📊 Ejemplo conceptual en ML
Datos ↓ Cuartiles ↓ Análisis robusto ↓ Mejor modelado
🧠 Interpretación profunda
Los cuartiles reflejan un principio clave:
👉 Entender la distribución es tan importante como conocer el promedio
Permiten:
- analizar dispersión
- detectar outliers
- comprender estructura de datos
Conclusión
Los cuartiles dividen los datos en cuatro partes iguales y son esenciales para analizar la distribución, dispersión y detectar outliers.
👉 Son una herramienta clave en análisis de datos y machine learning.
Related Concepts
- Mediana
- Percentiles
- IQR
- Outliers
- Distribución