Home

populatiecorrelatie

Populatiecorrelatie is in de statistiek de maat voor de sterkte en richting van een lineaire relatie tussen twee willekeurige variabelen X en Y in de populatie. De populatiecorrelatiecoëfficiënt, vaak aangeduid met ρ (rho), wordt gedefinieerd als ρ = Cov(X,Y) / (σ_X σ_Y), waarbij Cov(X,Y) de populatiecovariantie is en σ_X en σ_Y de populatie-standaarddeviaties van X en Y.

Kenmerken van ρ zijn onder meer dat het bereik tussen -1 en 1 ligt. Een waarde van ρ =

Schatting van populatiecorrelatie gebeurt via de steekproef: de steekproefcorrelatie r dient als schatter van ρ. R wordt

Toepassing en beperkingen: populatiecorrelatie beschrijft uitsluitend lineariteit en zegt niets over causaliteit. Bij niet-lineaire relaties of

Relatie met regressie: wanneer X en Y gestandaardiseerd zijn, is de regressieslope gelijk aan ρ, wat de

Samenvatting: ρ is een fundamentele parameter die de lineaire samenhang tussen twee variabelen in de populatie kwantificeert

1
(respectievelijk
-1)
duidt
op
een
perfecte
positieve
(negatieve)
lineaire
relatie;
ρ
=
0
duidt
op
geen
lineaire
relatie.
Onafhankelijkheid
van
X
en
Y
impliceert
ρ
=
0,
maar
een
nulwaarde
van
ρ
betekent
niet
noodzakelijk
onafhankelijkheid
(behalve
onder
specifieke
verdelingen
zoals
de
multivariate
normaalverdeling).
berekend
met
de
Pearson-formule
en
ligt
eveneens
in
het
interval
[-1,1].
De
steekproefcorrelatie
kan
gevoelig
zijn
voor
uitbijters
en
veronderstelt
een
lineaire
relatie
en
constante
variantie.
uitgesproken
uitbijters
kan
r
een
vertekend
beeld
geven;
in
sommige
gevallen
kunnen
robuuste
of
rangcorrelaties
(zoals
Spearman)
meer
informatief
zijn.
interpretatie
van
sterkte
en
richting
versterkt.
en
dient
als
basis
voor
inferentie
en
modelbouw,
mits
de
aannames
van
lineariteit
en
normaliteit
in
overweging
worden
genomen.