Home

ClusterStichproben

Clusterstichprobe, auch Cluster-Sampling genannt, ist eine probabilistische Stichprobenmethode in der Statistik. Die Population wird in mehrere Cluster unterteilt, die intern heterogen, aber extern vergleichbar sein sollen. Aus diesen Clustern werden zufällig einige ausgewählt. In den ausgewählten Clustern wird dann entweder die gesamte Grundgesamtheit untersucht oder eine weitere Stichprobe von Elementen gezogen. Das Verfahren eignet sich besonders, wenn eine vollständige Stichprobenrahmen für Einzelpersonen schwer zu erstellen ist oder geografische Distanz eine Rolle spielt.

Beim Ein-Stufen-Design (one-stage) werden alle Elemente in den ausgewählten Clustern untersucht. Beim Zwei-Stufen-Design (two-stage) wählt man

Vorteile liegen in geringeren Kosten und größerer Praktikabilität bei großen oder geografisch gestreuten Populationen, da kein

Zu den Nachteilen zählen eine erhöhte Varianz gegenüber einfachen Zufallsstichproben, bedingt durch die Intracluster-Korrelation (ρ) und die

Typische Anwendungen finden sich in großen Bevölkerungsbefragungen, Bildungsstudien mit Schulen als Clustern oder Gesundheitsstudien, in denen

zunächst
Cluster
aus,
anschließend
eine
Stichprobe
von
Elementen
innerhalb
dieser
Cluster.
In
beiden
Fällen
müssen
die
Stichproben
angemessen
gewichtet
werden,
um
Populationsanteile
korrekt
abzubilden.
vollständiger
Rahmen
nötig
ist.
Clusterstichproben
eignen
sich
gut
für
national
angelegte
oder
mehrstufige
Befragungen,
Bildungs-
oder
Gesundheitserhebungen,
bei
denen
Einrichtungen
oder
Nachbarschaften
als
Cluster
dienen.
Clustergröße
(m).
Der
Design-Effekt
DEFF
≈
1
+
(m−1)ρ
beschreibt
diese
Mehrvarianz.
Unausgeglichene
Clustergrößen
oder
systematische
Unterschiede
zwischen
Clustern
können
Verzerrungen
verursachen.
Daher
ist
eine
sorgfältige
Planung
nötig,
einschließlich
der
Bestimmung
der
geeigneten
Anzahl
und
Größe
der
Cluster
sowie
geeigneter
Gewichtungs-
und
Analyseverfahren.
Häuserblöcke
oder
Nachbarschaften
als
Cluster
dienen.
Die
Methode
bleibt
flexibel,
erfordert
jedoch
eine
korrekte
Berücksichtigung
der
Struktur
der
Stichprobe
in
der
Auswertung.