Home

nhoofdcomponent

n-hoofdcomponent, vaak aangeduid als de n-de hoofdcomponent, is een begrip uit principal component analysis (PCA). PCA is een statistische methode die data reduceert door lineaire combinaties van de oorspronkelijke variabelen te zoeken die zo veel mogelijk variatie in de data vastleggen. De eerste hoofdcomponent deelt de grootste variatie mee, de tweede is orthogonaal aan de eerste en toont de grootste resterende variatie, enzovoort.

Wiskundig gezien wordt meestal een centrumde (en indien nodig genormaliseerde) data-matrix X gebruikt. Via een singular

De n-de hoofdcomponent is dus de projectie van de data op de n-de laadingvector. In praktische toepassingen

Let wel: PCA gaat uit van lineaire relaties, vereist passende schaalvorming en is gevoelig voor uitbijters.

value
decomposition
X
=
U
Σ
V^T
komen
de
kolommen
van
V
overeen
met
de
richtingen
van
de
hoofdcomponenten.
De
i-de
kolom
van
V
is
de
laadingvector
voor
de
i-de
hoofdcomponent.
De
scores
t_i
voor
elke
waarneming
worden
verkregen
door
t_i
=
X
v_i,
waarbij
v_i
de
i-de
laadingvector
is.
De
eigenwaarden
λ_i
geven
de
hoeveelheid
verklaarde
variantie
door
elke
hoofdcomponent
aan;
de
verhouding
λ_i
/
(totaal
λ)
geeft
de
verklaarde
variantiepercentage
van
de
i-de
component.
wordt
vaak
gekozen
voor
de
eerste
k
hoofdcomponenten
om
dimensies
terug
te
brengen
en
tegelijkertijd
zo
veel
mogelijke
variatie
te
behouden.
De
laadingen
geven
inzicht
in
de
bijdrage
van
de
oorspronkelijke
variabelen
aan
elke
component.
Interpretatie
van
componenten
kan
per
dataset
verschillen
en
soms
aanvullende
transformaties
of
robuuste
versies
zijn
wenselijk.