💡 Reducción dimensional

La reducción dimensional es un conjunto de técnicas para transformar datos con muchísimas variables (alta dimensión) a un espacio con menos (baja dimensión) intentando mantener la información crucial. Piénsalo como reducir el «cuento» a su «moraleja».

Utilidades

  • Ver relaciones complejas en 2D/3D.
  • Agilizar y optimizar algoritmos (tiempo y memoria).
  • Filtrar variables «ruido» o redundantes.

Métodos

  • Varianza (ej. PCA): Busca las direcciones de máxima dispersión (útil para relaciones lineales).
  • Vecindad (ej. t-SNE, UMAP): Encuentran el parentesco entre muestras (ideal para estructuras no lineales).
  • Redes neuronales (ej. Autoencoders): Aprenden a comprimir datos (encoder) para poder reconstruirlos (decoder)

Lo malo ⚠️

Hay pérdida de información y a veces cuesta interpretar las nuevas dimensiones.

Para saber más