Home

Hauptkomponente

Hauptkomponente ist ein Begriff aus der Statistik, der in der Hauptkomponentenanalyse (PCA) verwendet wird. Sie bezeichnet eine Richtung im Merkmalsraum, entlang der die Daten die größteVarianz aufweisen. Die Hauptkomponenten bilden eine Folge orthogonaler Richtungen, die als neue Koordinatenbasis dient. Mathematisch entsprechen die Hauptkomponenten den Eigenvektoren der Kovarianzmatrix der Daten oder den Spalten der Matrizen, die aus der singulärwertzerlegung (SVD) der zentrierten Daten resultieren. Die Reihenfolge der Komponenten entspricht der Größe der jeweiligen Varianz, die sie erklären.

Berechnung: Zunächst werden die Merkmale zentriert (und ggf. skaliert). Dann wird die Kovarianzmatrix Cov(X) berechnet und

Interpretation: Jede Hauptkomponente ist eine lineare Kombination der ursprünglichen Variablen; die Koeffizienten (Loadings) zeigen deren Beitragsstärke.

Anwendungen und Einschränkungen: PCA dient der Dimensionsreduktion, Visualisierung, Rauschunterdrückung und Feature-Extraction in Bereichen wie Bildverarbeitung, Genomik

Siehe auch: Principal Component Analysis; SVD; Dimensionality Reduction.

das
Eigenwertproblem
Cov(X)
v
=
λ
v
gelöst.
Die
Hauptkomponenten
sind
die
Projektionen
der
Daten
auf
die
Eigenrichtungen,
X
v.
Alternativ
führt
die
SVD
X
=
U
Σ
V^T
dazu,
wobei
die
Spalten
von
V
die
Hauptkomponentenrichtungen
und
die
Diagonalwerte
von
Σ
die
erklärte
Varianz
liefern.
Die
erste
Komponente
erklärt
den
größten
Anteil
der
Varianz,
die
folgenden
unter
der
Bedingung
der
Orthogonalität.
Die
Komponenten
sind
zwar
technisch
aussagekräftig,
ihre
inhaltliche
Interpretation
hängt
stark
von
den
Variablen
ab.
oder
Finanzanalyse.
Einschränkungen:
linear,
empfindlich
gegenüber
Skalierung
und
Ausreißern;
Komponenten
können
schwer
interpretierbar
sein
und
setzen
eine
geeignete
Standardisierung
voraus.