La reducción dimensional es un conjunto de técnicas para transformar datos con muchísimas variables (alta dimensión) a un espacio con menos (baja dimensión) intentando mantener la información crucial. Piénsalo como reducir el «cuento» a su «moraleja».
Utilidades
- Ver relaciones complejas en 2D/3D.
- Agilizar y optimizar algoritmos (tiempo y memoria).
- Filtrar variables «ruido» o redundantes.
Métodos
- Varianza (ej. PCA): Busca las direcciones de máxima dispersión (útil para relaciones lineales).
- Vecindad (ej. t-SNE, UMAP): Encuentran el parentesco entre muestras (ideal para estructuras no lineales).
- Redes neuronales (ej. Autoencoders): Aprenden a comprimir datos (encoder) para poder reconstruirlos (decoder)
Lo malo ⚠️
Hay pérdida de información y a veces cuesta interpretar las nuevas dimensiones.