Home

Verspreidheid

Verspreidheid is een term die in het Nederlands op twee manieren wordt gebruikt: in de statistiek als aanduiding van de mate waarin een dataset verspreid is, en in het bredere sociale en geografische taalgebruik om de mate van verspreiding van een fenomeen over een gebied of populatie aan te geven. In de statistiek beschrijft versprijdheid hoe ver waarden van een variabele uiteenliggen rond een centrale maat zoals het gemiddelde of de mediaan. Een dataset met hoge verspreiding kent een grote variatie in de waarden, terwijl een dataset met lage verspreiding consistenter is.

Belangrijke maatstaven voor verspreiding zijn onder andere het bereik (het verschil tussen de grootste en kleinste

In beschrijvende analyse helpt versprijdheid naast de centrale maat om patronen te zien en om onzekerheid

waarde),
de
interquartielafstand
of
IQR
(het
verschil
tussen
Q3
en
Q1,
robuuster
tegen
outliers),
de
variantie
en
de
standaarddeviatie
(gemiddelde
kwadratische
afwijking
van
het
gemiddelde),
en
de
coëfficiënt
van
variatie
(de
standaarddeviatie
gedeeld
door
het
gemiddelde,
uitgedrukt
als
percentage).
Elke
maat
heeft
voor-
en
nadelen:
het
bereik
kan
sterk
door
outliers
worden
beïnvloed;
de
IQR
is
robuuster
maar
minder
volledig;
de
variatie
en
standaarddeviatie
zijn
uitgedrukt
in
dezelfde
eenheden
als
de
data;
de
CV
maakt
vergelijking
tussen
datasets
met
verschillende
gemiddelden
mogelijk.
te
beoordelen.
Ze
beïnvloedt
ook
inferentiële
concepten
zoals
betrouwbaarheidsintervallen
en
testsensitiviteit.
Buiten
de
statistiek
wordt
verspreiding
gebruikt
om
maatschappelijke
en
geografische
vragen
te
verkennen,
zoals
hoe
een
ziekte,
inkomen
of
productiviteit
over
een
regio
of
populatie
is
verdeeld.
Interpretationeel
wijst
hoge
verspreiding
vaak
op
heterogene
processen,
terwijl
lage
verspreiding
op
uniformiteit
kan
duiden.