Home

Pearsoncorrelatiecoëfficiënt

De Pearsoncorrelatiecoëfficiënt, afgekort als r, is een statistische maat voor de lineaire relatie tussen twee continue variabelen. De waarde ligt tussen -1 en 1. Een waarde van +1 duidt op een perfecte positieve lineaire relatie, -1 op een perfecte negatieve lineaire relatie, en 0 op geen lineaire relatie. Het onderwerp meet dus zowel de sterkte als de richting van de lineaire associatie tussen de variabelen.

Berekening: voor een steekproef met n waarnemingen X = (x1,…,xn) en Y = (y1,…,yn) is r = Σ (x_i − x̄)(y_i

Interpretatie en gebruik: r geeft aan in hoeverre variabelen lineair samenhangen. Een grotere absolute waarde duidt

Aannames en beperkingen: de maat gaat uit van lineariteit en meet op een interval- of ratio-schaal. Uitbijters

Gerelateerde maten en alternatieven: Spearman’s rho en Kendall’s tau zijn gebaseerd op rangordes en kunnen monotone,

−
ȳ)
/
sqrt[
Σ
(x_i
−
x̄)^2
Σ
(y_i
−
ȳ)^2
].
In
de
populatie
wordt
r
uitgedrukt
als
ρ
=
Cov(X,Y)
/
(σ_X
σ_Y).
Er
is
ook
de
bijbehorende
inferentiële
benadering
waarbij
significantie
kan
worden
getoetst
met
bijvoorbeeld
de
t-verdeling:
t
=
r
sqrt((n−2)/(1−r^2))
met
df
=
n−2.
op
een
sterkere
lineaire
relatie.
Let
op:
een
hoge
correlatie
impliceert
geen
causaliteit
en
kan
vertekend
raken
door
uitbijters,
een
beperkt
bereik
van
de
data
(restricted
range)
of
niet-lineaire
relaties.
kunnen
r
sterk
beïnvloeden,
en
een
afname
of
toename
in
r
kan
optreden
bij
heteroscedasticiteit
of
niet-normale
data.
Voor
non-lineaire
relaties
kan
r
weinigzeggend
zijn
en
bestaan
er
andere
maten.
maar
mogelijk
niet-lineaire
relaties
beter
weergeven.
Naast
hoe
r
de
relatie
aanduidt,
wordt
ook
vaak
gekeken
naar
de
betrouwbaarheid
van
de
schatting
en
de
significantie
in
wetenschappelijk
onderzoek.