Home

StichprobenVarianz

Stichprobenvarianz, in der Statistik häufig als s^2 bezeichnet, ist eine Kennzahl zur Dispersion einer Stichprobe und dient als Schätzer der Populationsvarianz. Gegeben eine Stichprobe x_1, x_2, ..., x_n mit Stichprobenmittelwert x̄ wird die Stichprobenvarianz berechnet als s^2 = (1/(n-1)) · ∑_{i=1}^n (x_i − x̄)^2. Der Nenner n−1 sorgt dafür, dass s^2 im Erwartungswert der Populationsvarianz σ^2 entspricht (unbiasedness) bei unabhängigen Stichproben mit endlicher Varianz.

Die Populationsvarianz σ^2 ist E[(X − μ)^2], wobei μ der Populationsmittelwert ist. Im Gegensatz dazu verwendet die Stichprobenvarianz

Aus der Stichprobenvarianz ergibt sich die Stichprobenstandardabweichung s = sqrt(s^2) als entsprechend empfindliche Dispersion-Maßeinheit, die oft zusammen

In der Praxis wird s^2 in Statistiksoftware typischerweise mit Funktionen berechnet, die die Freiheitsgrade n−1 berücksichtigen

den
Faktor
n−1
im
Nenner,
wodurch
sie
eine
unverzerrte
Schätzung
von
σ^2
darstellt.
Unter
der
Annahme
einer
normalverteilten
Grundgesamtheit
folgt
(n−1)s^2/σ^2
einer
Chi-Quadrat-Verteilung
mit
n−1
Freiheitsgraden;
diese
Eigenschaft
wird
in
der
Inferenz
über
den
Populationsmittelwert
genutzt,
etwa
beim
Aufbau
von
Konfidenzintervallen
oder
bei
t-Tests.
mit
s^2
berichtet
wird.
Die
Schätzung
ist
besonders
sensibel
gegenüber
Ausreißern
und
der
Stichprobengröße;
bei
kleinen
Stichproben
ist
die
Varianzschätzung
stärker
streuend.
(z.
B.
Var(x,
ddof=1)
in
gängigen
Paketen).