Dimensionalidad

Dimensionalidad

Cuántas variables definen un espacio o un conjunto de datos

La dimensionalidad se refiere al número de variables, características o ejes necesarios para describir un dato o un espacio. Es un concepto fundamental en matemáticas, estadística y machine learning.

👉 En términos simples:
más dimensiones = más información (pero también más complejidad)


Definición corta

La dimensionalidad es el número de variables o características de un sistema.

Definición detallada

Para un vector:x=[x1,x2,...,xn]x = [x_1, x_2, …, x_n]

👉 La dimensionalidad es:nn

Intuición

La dimensionalidad responde:

👉 “¿Cuántos valores necesito para describir completamente este dato?”

Ejemplos

  • Punto en línea → 1 dimensión
  • Punto en plano → 2 dimensiones
  • Punto en espacio → 3 dimensiones

En machine learning:

Edad, ingresos, ubicación → 3 dimensiones

Interpretación geométrica

DimensionesRepresentación
1Dlínea
2Dplano
3Despacio
nDespacio abstracto

👉 A partir de 4D, no es visualizable directamente.

Relación con otros conceptos

Alta vs baja dimensionalidad

🔹 Baja dimensionalidad

  • Fácil de visualizar
  • Menos complejidad

🔹 Alta dimensionalidad

  • Más información
  • Más difícil de procesar

👉 Puede causar problemas como:

⚠️ Maldición de la dimensionalidad

  • Datos dispersos
  • Distancias menos significativas
  • Modelos más complejos

Dimensionalidad en redes neuronales

🔹 1. Features (características)

Cada feature:

👉 añade una dimensión

🔹 2. Embeddings

Vectores de alta dimensión:

Word embedding → 300 dimensiones

🔹 3. Reducción de dimensionalidad

Técnicas como:

  • PCA
  • Autoencoders

👉 reducen dimensiones manteniendo información.

🔹 4. Capacidad del modelo

Más dimensiones:

👉 mayor capacidad de representación

Ejemplo paso a paso

[altura, peso, edad]

👉 vector de dimensión 3.

Dimensionalidad vs rango

ConceptoSignificado
Dimensiónnúmero de variables
Rangonúmero de variables independientes

👉 Un dataset puede tener alta dimensión pero bajo rango.

Ejemplo conceptual

100 features → 100 dimensiones  
pero solo 10 relevantes → rango bajo

Ejemplo en Python

import numpy as np
x = np.array([1, 2, 3, 4])
print("Dimensión:", x.shape[0])

Ejemplo en matrices

import numpy as np
X = np.array([
[1, 2, 3],
[4, 5, 6]
])
print("Filas:", X.shape[0])
print("Columnas (dimensión):", X.shape[1])

Ejemplo en PyTorch

import torch
x = torch.tensor([1.0, 2.0, 3.0])
print("Dimensión:", x.shape[0])

Ejemplo con embeddings

import torch
embedding = torch.randn(300)
print("Dimensión embedding:", embedding.shape[0])

Qué muestra este ejemplo

  • Cómo medir dimensiones
  • Relación con features
  • Uso en embeddings

Errores comunes

Confundir dimensión con tamaño de datos

No son lo mismo.


Ignorar redundancia

Alta dimensión ≠ alta información.

Subestimar la maldición de dimensionalidad

Puede degradar modelos.

Ejemplo conceptual en ML

Imagen 28x28 → 784 dimensiones

👉 Cada píxel es una dimensión.

Interpretación profunda

La dimensionalidad define:

  • la complejidad del espacio
  • la capacidad del modelo
  • la estructura de los datos
  • la dificultad del aprendizaje

👉 Es uno de los factores más importantes en machine learning.

Conclusión

La dimensionalidad describe cuántas variables se necesitan para representar un dato. Es clave para entender la complejidad, la capacidad del modelo y los desafíos del aprendizaje.

👉 Controlar la dimensionalidad es clave para construir modelos eficientes.

Related Concepts

  • Vector
  • Rango
  • PCA
  • Embeddings
  • Espacio vectorial