Dimensionalidad
Cuántas variables definen un espacio o un conjunto de datos
La dimensionalidad se refiere al número de variables, características o ejes necesarios para describir un dato o un espacio. Es un concepto fundamental en matemáticas, estadística y machine learning.
👉 En términos simples:
más dimensiones = más información (pero también más complejidad)
Definición corta
La dimensionalidad es el número de variables o características de un sistema.
Definición detallada
Para un vector:
👉 La dimensionalidad es:
Intuición
La dimensionalidad responde:
👉 “¿Cuántos valores necesito para describir completamente este dato?”
Ejemplos
- Punto en línea → 1 dimensión
- Punto en plano → 2 dimensiones
- Punto en espacio → 3 dimensiones
En machine learning:
Edad, ingresos, ubicación → 3 dimensiones
Interpretación geométrica
| Dimensiones | Representación |
|---|---|
| 1D | línea |
| 2D | plano |
| 3D | espacio |
| nD | espacio abstracto |
👉 A partir de 4D, no es visualizable directamente.
Relación con otros conceptos
Alta vs baja dimensionalidad
🔹 Baja dimensionalidad
- Fácil de visualizar
- Menos complejidad
🔹 Alta dimensionalidad
- Más información
- Más difícil de procesar
👉 Puede causar problemas como:
⚠️ Maldición de la dimensionalidad
- Datos dispersos
- Distancias menos significativas
- Modelos más complejos
Dimensionalidad en redes neuronales
🔹 1. Features (características)
Cada feature:
👉 añade una dimensión
🔹 2. Embeddings
Vectores de alta dimensión:
Word embedding → 300 dimensiones
🔹 3. Reducción de dimensionalidad
Técnicas como:
- PCA
- Autoencoders
👉 reducen dimensiones manteniendo información.
🔹 4. Capacidad del modelo
Más dimensiones:
👉 mayor capacidad de representación
Ejemplo paso a paso
[altura, peso, edad]
👉 vector de dimensión 3.
Dimensionalidad vs rango
| Concepto | Significado |
|---|---|
| Dimensión | número de variables |
| Rango | número de variables independientes |
👉 Un dataset puede tener alta dimensión pero bajo rango.
Ejemplo conceptual
100 features → 100 dimensiones
pero solo 10 relevantes → rango bajo
Ejemplo en Python
import numpy as npx = np.array([1, 2, 3, 4])print("Dimensión:", x.shape[0])
Ejemplo en matrices
import numpy as npX = np.array([ [1, 2, 3], [4, 5, 6]])print("Filas:", X.shape[0])print("Columnas (dimensión):", X.shape[1])
Ejemplo en PyTorch
import torchx = torch.tensor([1.0, 2.0, 3.0])print("Dimensión:", x.shape[0])
Ejemplo con embeddings
import torchembedding = torch.randn(300)print("Dimensión embedding:", embedding.shape[0])
Qué muestra este ejemplo
- Cómo medir dimensiones
- Relación con features
- Uso en embeddings
Errores comunes
Confundir dimensión con tamaño de datos
No son lo mismo.
Ignorar redundancia
Alta dimensión ≠ alta información.
Subestimar la maldición de dimensionalidad
Puede degradar modelos.
Ejemplo conceptual en ML
Imagen 28x28 → 784 dimensiones
👉 Cada píxel es una dimensión.
Interpretación profunda
La dimensionalidad define:
- la complejidad del espacio
- la capacidad del modelo
- la estructura de los datos
- la dificultad del aprendizaje
👉 Es uno de los factores más importantes en machine learning.
Conclusión
La dimensionalidad describe cuántas variables se necesitan para representar un dato. Es clave para entender la complejidad, la capacidad del modelo y los desafíos del aprendizaje.
👉 Controlar la dimensionalidad es clave para construir modelos eficientes.
Related Concepts
- Vector
- Rango
- PCA
- Embeddings
- Espacio vectorial