Dimensionenreduktion
Dimensionenreduktion bezeichnet Verfahren zur Verringerung der Merkmalsanzahl in Datensätzen, wobei zentrale Strukturen oder Informationen möglichst erhalten bleiben. Ziel ist es, die Komplexität zu verringern, die Rechenlast zu senken, Rauschen zu reduzieren und die Visualisierung oder das Lernen zu erleichtern.
Man unterscheidet zwischen Feature Selection, bei der vorhandene Merkmale selektiv beibehalten werden, und Feature Extraction, bei
Zu den linearen Methoden gehören Principal Component Analysis (PCA), die Hauptkomponenten anhand der Varianz bestimmt, sowie
Anwendungen umfassen die Visualisierung von hochdimensionalen Daten in 2D oder 3D, die Vorverarbeitung für maschinelles Lernen,
Bewertung erfolgt oft anhand der erklärten Varianz (bei PCA), Rekonstruktionsfehler, Beibehaltung von Paarabständen oder topologischen Eigenschaften
Herausforderungen sind die Wahl der Zieldimension, Interpretierbarkeit der reduzierten Repräsentationen, Rechenaufwand sowie potenzielle Verzerrungen oder Informationsverluste,