Home

korrelationskoefficient

Korrelationskoefficient är en statistisk mått som beskriver riktningen och styrkan i sambandet mellan två variabler. Den anger hur väl en ökning i en variabel sammanfaller med en ökning eller minskning i den andra. Spektrumet sträcker sig från -1 till +1 där 0 oftast innebär att det inte finns någon linjär relation mellan variablerna. Det är viktigt att notera att ett högre absolutvärde inte innebär kausalitet utan endast ett samband.

Den vanligaste typen är Pearsons korrelationskoefficient, betecknad r. Den mäter graden av linjärt samband och beräknas

Icke-parametriska alternativ som Spearmans rangkorrelationskoefficient (rho) och Kendalls tau används när sambandet är monotont men inte

Praktiska överväganden inkluderar betydelsen av antal observationer, signifikansnivå och konfidensintervall för koefficienten. Det är också viktigt

som
r
=
cov(X,Y)
/
(s_x
s_y).
Pearsons
r
förutsätter
kontinuerliga
data
på
intervall-
eller
kvotskala,
en
ungefär
linjär
relation
och
ofta
att
variablerna
är
ungefär
normalfördelade.
Den
är
känslig
för
outliers
och
kan
ge
missvisande
resultat
vid
icke-linjiga
samband
eller
snedfördelningar.
Värdet
tolkas
ofta
som
svag,
måttlig
eller
stark
korrelation
beroende
på
konventioner.
nödvändigtvis
linjärt,
eller
när
data
inte
uppfyller
Pearsons
antaganden.
Dessa
beräknas
på
rangordnade
värden
och
är
mindre
känsliga
för
outliers.
att
skilja
mellan
korrelation
och
orsakssammanhang;
korrelation
innebär
inte
bevis
för
kausalitet.
Vid
kategoriska
variabler
används
andra
mått
såsom
Phi
eller
Cramérs
V.