Home

Pearsoncorrelatie

Pearsoncorrelatie, ook wel de Pearson-correlatiecoëfficiënt genoemd, is een maat voor de lineariteit en sterkte van de associatie tussen twee continue variabelen X en Y. Een positieve waarde duidt op een positieve lineaire relatie, een negatieve waarde op een negatieve lineaire relatie, en een waarde dicht bij nul wijst op weinig tot geen lineaire relatie.

De correlatie wordt gedefinieerd als r = cov(X,Y) / (σ_X σ_Y). In steekproeven wordt meestal gebruikgemaakt van r

Interpretatie en gebruik. Pearsoncorrelatie geeft richting en sterkte van een lineaire verband aan, maar impliceert geen

Aannames en overwegingen. Er wordt uitgegaan van lineariteit en homoscedasticiteit. Als een van de variabelen geen

Toepassing. Veelgebruikte toepassingen zijn exploratieve data-analyse, regressiediagnostiek en het toetsen van de sterkte/directionele van lineaire relaties

=
Σ
(x_i
-
x̄)(y_i
-
ȳ)
/
sqrt(
Σ
(x_i
-
x̄)^2
Σ
(y_i
-
ȳ)^2
).
De
waarde
ligt
altijd
tussen
-1
en
1.
Een
waarde
nabij
±1
wijst
op
een
sterke
lineaire
relatie,
terwijl
een
waarde
dicht
bij
0
wijst
op
een
zwakke
of
afwezige
lineaire
relatie.
causale
relatie.
De
maat
is
gevoelig
voor
uitbijters
en
vereist
doorgaans
continue,
op
interval-
of
ratio-schaal
gemeten
variabelen
met
een
ongeveer
lineair
verband.
Voor
inference
over
de
populatiecorrelatie
wordt
vaak
de
t-verdeling
gebruikt:
met
n-2
vrijheidsgraden
is
t
=
r
sqrt((n-2)/(1-r^2));
de
bijbehorende
p-waarde
bepaalt
of
de
waargenomen
overeenkomst
significant
afwijkt
van
nul.
variantie
heeft
(constant),
is
de
correlatie
niet
gedefinieerd.
Alternatieven
zoals
Spearman-rho
of
Kendall’s
tau
zijn
nuttig
bij
monotone
relaties
of
bij
uitbijters.
tussen
variabelen.