Home

Parallelanalyse

Parallelanalyse, kurz PA, ist eine statistische Methode zur Bestimmung der Anzahl latenter Faktoren oder Komponenten, die in einem Datensatz beibehalten werden sollten. Ziel ist es, die dimensionale Struktur der Daten zu schätzen, indem beobachtete Muster mit Zufallsdaten verglichen werden.

Das Verfahren erzeugt zufällige Referenzdaten mit derselben Anzahl von Beobachtungen und Variablen wie der Originaldatensatz. Für

PA kann als Teil einer explorativen Faktoranalyse (EFA) oder einer Hauptkomponentenanalyse (PCA) eingesetzt werden. Es gibt

Historisch wurde PA von Gordon Horn im Jahr 1965 eingeführt. In der Praxis ist sie in Statistik-Software

diese
Referenzdaten
werden
die
Eigenwerte
der
Korrelationsmatrix
bzw.
der
Kovarianzmatrix
berechnet
und
über
viele
Iterationen
eine
Verteilung
der
zufälligen
Eigenwerte
erzeugt.
Die
beobachteten
Eigenwerte
der
Originaldaten
werden
dann
mit
dieser
Verteilung
verglichen,
typischerweise
indem
man
die
Faktoren
behält,
deren
Eigenwerte
die
entsprechenden
Zufallswerte
übersteigen
(oft
am
95.
Perzentil).
Varianten
wie
Monte-Carlo-PA
oder
Permutations-PA.
Die
Methode
gilt
als
robusterer
Indikator
für
die
richtige
Anzahl
von
Dimensionen
als
einfache
Faustregel
wie
das
Kaiser-Kriterium.
implementiert,
etwa
in
entsprechenden
Paketen
und
Bibliotheken,
die
parallele
Analyse
unterstützen.