Home

sampleskævheden

Sampleskævheden er et mål for, hvor asymmetrisk en stikprøves fordeling er i forhold til en symmetrisk fordeling. Den bruges til at beskrive, om dataene har en længere hale til højre eller til venstre. En nøjagtig fortolkning afhænger af konteksten og stikprøvens størrelse. I praksis bruges sampleskævheden ofte som et deskriptivt mål og som input til normalitetstests.

Beregningsmæssigt findes der flere almindelige formuleringer. En udbredt deskriptiv estimator definerer g1 som g1 = m3 / (m2)^(3/2),

Fortolkningen er som regel: positive værdier indikerer højre-side hale, negative værdier venstre-hale. Under en normalfordeling er

hvor
m2
og
m3
er
de
tredje
og
anden
centrale
øjeblik
i
stikprøven:
m2
=
(1/n)
Σ
(xi
−
x̄)^2,
m3
=
(1/n)
Σ
(xi
−
x̄)^3,
og
x̄
er
stikprøvens
gennemsnit.
En
mere
anvendt,
biaskorrekt
estimator
tager
hensyn
til
stikprøvens
størrelse
og
anvender
standardafvigelsen
s
til
normalisering:
g1
=
(1/n)
Σ
[(xi
−
x̄)/s]^3,
med
s^2
=
(1/(n−1))
Σ
(xi
−
x̄)^2.
Den
klassiske
biaskorrekte
version
af
skævheden
kaldes
ofte
Fisher-Pearson-skævhed
og
erhverver
en
faktor
afhængig
af
n,
f.eks.
G1
=
(n^2
/
((n−1)(n−2)))
·
g1.
populationens
skævhed
0,
men
stikprøvens
skævhed
kan
afvige
betydeligt
for
små
n
og
er
følsom
over
for
outliers.
Sampleskævheden
anvendes
i
test
for
normalitet
og
i
sammenligning
af
fordelinger
mellem
grupper.