Hauptkomponentenanalyse
Die Hauptkomponentenanalyse (PCA) ist eine statistische Methode zur Reduktion der Dimensionalität von Datensätzen. Sie transformiert die ursprünglichen Variablen in eine neue, lineare Basis aus Hauptkomponenten, die die meiste Varianz der Daten erklären. Die Hauptkomponenten sind orthogonal zueinander und folgen der Reihenfolge ihrer erklärte Varianz.
Mathematisch basiert PCA auf der Kovarianzmatrix der Daten. Nach Zentrierung der Daten (und ggf. Standardisierung) wird
Die Wahl der Anzahl k der Hauptkomponenten erfolgt oft anhand der erklärten Varianz, beispielsweise über einen
Anwendungen finden sich in der Bild- und Spracherkennung, der Datenkompression, der explorativen Datenanalyse, der Visualisierung hochdimensionaler
Historisch wurde die Methode 1901 von Karl Pearson eingeführt; der Begriff Hauptkomponenten bezieht sich auf die