Pearsonkorrelasjonen
Pearsonkorrelasjonen, ofte kalt Pearson-r, er et mål for graden av lineær sammenheng mellom to kontinuerlige variabler. Den beskriver hvor tett dataene følger en rett linje når X og Y bæres mot hverandre. Verdien ligger mellom -1 og +1: +1 indikerer en perfekt positiv lineær sammenheng, -1 en perfekt negativ lineær sammenheng, og 0 ingen lineær sammenheng.
For et datasett med n observasjoner er Pearson-r definert som r = sum_{i=1}^n (X_i − X̄)(Y_i − Ȳ) / sqrt( sum_{i=1}^n
Populasjonens korrelasjonskoeffisient kalles ρ (rho).
Antagelser og tolkning: Pearson-r krever kvantitative data og måler den lineære delen av forholdet mellom variablene.
Begrensninger: korrelasjon betyr ikke årsakssammenheng, og resultatet kan påvirkes av outliers, skjev fordeling eller heteroskedastisitet. Pearson-r