Dimensionalidad

Cuántas variables definen un espacio o un conjunto de datos

La dimensionalidad se refiere al número de variables, características o ejes necesarios para describir un dato o un espacio. Es un concepto fundamental en matemáticas, estadística y machine learning.

👉 En términos simples:
más dimensiones = más información (pero también más complejidad)

Definición corta

La dimensionalidad es el número de variables o características de un sistema.

Definición detallada

Para un vector: $x = [x_1, x_2, …, x_n]$

👉 La dimensionalidad es: $n$

Intuición

La dimensionalidad responde:

👉 “¿Cuántos valores necesito para describir completamente este dato?”

Ejemplos

Punto en línea → 1 dimensión
Punto en plano → 2 dimensiones
Punto en espacio → 3 dimensiones

En machine learning:

Edad, ingresos, ubicación → 3 dimensiones

Interpretación geométrica

Dimensiones	Representación
1D	línea
2D	plano
3D	espacio
nD	espacio abstracto

👉 A partir de 4D, no es visualizable directamente.

Relación con otros conceptos

Vector
Espacio vectorial
Rango
PCA

Alta vs baja dimensionalidad

🔹 Baja dimensionalidad

Fácil de visualizar
Menos complejidad

🔹 Alta dimensionalidad

Más información
Más difícil de procesar

👉 Puede causar problemas como:

⚠️ Maldición de la dimensionalidad

Datos dispersos
Distancias menos significativas
Modelos más complejos

Dimensionalidad en redes neuronales

🔹 1. Features (características)

Cada feature:

👉 añade una dimensión

🔹 2. Embeddings

Vectores de alta dimensión:

Word embedding → 300 dimensiones

🔹 3. Reducción de dimensionalidad

Técnicas como:

PCA
Autoencoders

👉 reducen dimensiones manteniendo información.

🔹 4. Capacidad del modelo

Más dimensiones:

👉 mayor capacidad de representación

Ejemplo paso a paso

[altura, peso, edad]

👉 vector de dimensión 3.

Dimensionalidad vs rango

Concepto	Significado
Dimensión	número de variables
Rango	número de variables independientes

👉 Un dataset puede tener alta dimensión pero bajo rango.

Ejemplo conceptual

100 features → 100 dimensiones  
pero solo 10 relevantes → rango bajo

Ejemplo en Python

			
import numpy as np
x = np.array([1, 2, 3, 4])
print("Dimensión:", x.shape[0])

Ejemplo en matrices

			
import numpy as np
X = np.array([
    [1, 2, 3],
    [4, 5, 6]
])
print("Filas:", X.shape[0])
print("Columnas (dimensión):", X.shape[1])

		

Ejemplo en PyTorch

			
import torch
x = torch.tensor([1.0, 2.0, 3.0])
print("Dimensión:", x.shape[0])

Ejemplo con embeddings

			
import torch
embedding = torch.randn(300)
print("Dimensión embedding:", embedding.shape[0])

Qué muestra este ejemplo

Cómo medir dimensiones
Relación con features
Uso en embeddings

Errores comunes

Confundir dimensión con tamaño de datos

No son lo mismo.

Ignorar redundancia

Alta dimensión ≠ alta información.

Subestimar la maldición de dimensionalidad

Puede degradar modelos.

Ejemplo conceptual en ML

Imagen 28x28 → 784 dimensiones

👉 Cada píxel es una dimensión.

Interpretación profunda

La dimensionalidad define:

la complejidad del espacio
la capacidad del modelo
la estructura de los datos
la dificultad del aprendizaje

👉 Es uno de los factores más importantes en machine learning.

Conclusión

La dimensionalidad describe cuántas variables se necesitan para representar un dato. Es clave para entender la complejidad, la capacidad del modelo y los desafíos del aprendizaje.

👉 Controlar la dimensionalidad es clave para construir modelos eficientes.

Related Concepts

Vector
Rango
PCA
Embeddings
Espacio vectorial