Home

klassenverdeling

Klassenverdeling is een statistische methode om een dataset te verdelen over klassen of klassenintervallen, zodat de frequentie van waarnemingen binnen elk interval kan worden weergegeven. Deze indeling maakt het mogelijk om data compact te beschrijven en visualisaties zoals histogrammen te construeren. Voor continue variabelen wordt het meetbereik in klassen gesplitst; bij discrete variabelen kunnen categorieën gebruikt worden.

Bij het maken van een klassenverdeling worden meestal het aantal klassen en de klassebreedte bepaald. Een eenvoudige

Uit een klassenverdeling kunnen absolute frequenties (aantal waarnemingen per klasse), relatieve frequenties en cumulatieve frequenties afgeleiden.

Beperkingen: de keuze voor het aantal klassen en de grenzen kan de interpretatie beïnvloeden en informatieverlies

benadering
is
de
breedte
te
kiezen
als
(max
-
min)
/
k,
waarbij
k
het
gewenste
aantal
klassen
is.
De
grenzen
worden
zodanig
gekozen
dat
elke
waarneming
in
precies
één
klasse
valt;
grenzen
worden
vaak
als
gehele
of
halfopen
intervallen
gezet.
Diverse
regels
geven
aanbevelingen
voor
k,
zoals
Sturges'
regel
(k
ongeveer
1
+
log2(n)),
Scott’s
regel
en
Freedman-Diaconis-regel,
afhankelijk
van
de
dataset
en
gewenste
nauwkeurigheid.
Deze
informatie
ondersteunt
descriptieve
analyse
en
wordt
gebruikt
voor
het
construeren
van
histogrammen
en
voor
het
inspecteren
van
de
vorm
van
de
verdeling.
Een
voorbeeld:
een
dataset
met
leeftijden
kan
worden
verdeeld
in
klassen
zoals
0-9,
10-19,
20-29,
enz.,
waarna
het
aantal
personen
per
klasse
wordt
geteld.
veroorzaken.
Bij
grote
variabiliteit
of
scheve
verdelingen
kunnen
andere
indelingskeuzes
nuttig
zijn.
In
het
algemeen
dient
klassenverdeling
als
hulpmiddel
voor
data-inspectie
en
niet
als
een
exacte
representatie
van
alle
details.