Home

Korrelationsgrößen

Korrelationsgrößen sind Kennzahlen, die das Ausmaß einer statistischen Beziehung zwischen zwei Variablen beschreiben. Sie quantifizieren, wie eng Veränderungen in einer Variable mit Veränderungen in einer anderen Variable einhergehen. Im Gegensatz zur Kovarianz, die Richtung und Stärke der gemeinsamen Veränderung angibt, normieren Korrelationsgrößen die Kovarianz auf einen standardisierten Wertebereich von -1 bis 1.

Zu den bekanntesten Korrelationsgrößen gehören der Pearson-Korrelationskoeffizient r, der einen linearen Zusammenhang misst und berechnet wird

Korrelationsgrößen zeigen Korrelation, nicht Kausalität; eine hohe Korrelation bedeutet nicht, dass die eine Variable die andere

Anwendungen finden sich in der Psychometrie, Epidemiologie, Ökonomie und Datenanalyse, wo man Zusammenhänge zwischen Variablen untersucht,

als
r
=
Cov(X,Y)
/
(σ_X
σ_Y).
Werte
nahe
+1
oder
-1
deuten
auf
eine
starke
positive
bzw.
negative
lineare
Beziehung
hin;
Werte
um
0
zeigen
kaum
lineare
Abhängigkeit.
Pearson
setzt
eine
lineare
Beziehung
und
annähernde
Normalverteilung
der
Merkmale
voraus;
Ausreißer
können
die
Schätzung
stark
verzerren.
Spearman-Rangkorrelation
ρ
ist
eine
nicht-parametrische
Größe,
die
auf
Rangordnungen
basiert
und
monotone
Zusammenhänge
erfasst.
Kendall-Tau
τ
ist
eine
weitere
nicht-parametrische
Maßzahl,
die
auf
dem
Vergleich
von
Paaren
basiert
und
oft
robuster
gegenüber
Ausreißern
ist.
verursacht.
Scheinkorrelationen
durch
Drittvariablen
sind
möglich.
Die
statistische
Signifikanz
und
das
Konfidenzintervall
der
Koeffizienten
geben
Hinweise
auf
die
Zuverlässigkeit
der
Schätzung.
Bei
kleinen
Stichproben
ist
Vorsicht
geboten.
z.
B.
Zusammenhang
zwischen
Bildungsniveau
und
Einkommen
oder
zwischen
Aktienkursen.
In
der
Praxis
werden
oft
mehrere
Korrelationsgrößen
berichtet,
um
lineare
und
monotone
Abhängigkeiten
gleichermaßen
zu
prüfen.