Hyppighedsfordelinger
Hyppighedsfordeling beskriver, hvordan værdierne i et datasæt fordeler sig, og hvor ofte bestemte værdier eller intervaller forekommer. Den fungerer som grundlag for beskrivelse og videre analyse af data. Der skelnes mellem to hovedtyper: diskrete og kontinuerte hyppighedsfordelinger. For diskrete data tælles forekomster af hver værdi, og man kan beregne relative frekvenser som andelen af observationer. For kontinuerte data deles data op i intervaller, og man estimerer en sandsynlighedsstruktur gennem histogrammer og tæthedsfunktioner (probability density function, PDF) eller den kumulative fordelingsfunktion (CDF).
En teoretisk fordeling beskriver en forventet sandsynlighedsstruktur, f.eks. normal-, eksponential-, binomial- eller Poissonfordelingen. En empirisk fordeling
Anvendelser af hyppighedsfordelinger spænder fra beskrivelse af datasæt og sammenligning af grupper til estimering af sandsynligheder,