Home

uitschieters

Uitschieters is een statistische term voor waarden die ver afwijken van de overige waarnemingen in een dataset (ook wel outliers genoemd). Ze kunnen globaal of contextueel van aard zijn. Globale uitschieters wijken af van de algemene verdeling, ongeacht context, terwijl contextuele, of tijdsafhankelijke, uitschieters alleen extreem zijn in een specifieke context of periode.

Oorzaken van uitschieters variëren van meet- en invoerfouten tot zeldzame gebeurtenissen of natuurlijke variatie in de

Detectie gebeurt met verschillende methoden. De IQR-methode berekent Q1 en Q3 en beschouwt waarden buiten [Q1 −

Behandeling van uitschieters hangt af van de doelstelling en de aard ervan. Ze kunnen datafouten worden gecorrigeerd

data.
Ze
kunnen
aanwijzingen
geven
over
fouten
in
de
data
of
juist
oprecht
unieke
observaties
die
nader
onderzoek
waard
zijn.
1,5·IQR,
Q3
+
1,5·IQR]
als
uitschieters.
De
z-score
methode
identificeert
waarden
met
een
absolute
z-score
groter
dan
ongeveer
3.
Robuuste
methoden
zoals
MAD
(gemeten
absolute
deviatie)
verminderen
gevoeligheid
voor
extreme
waarden.
Voor
tijdreeksen
kunnen
afwijkingen
van
de
verwachte
trend
of
seizoenpatronen
als
uitschieters
worden
gezien,
terwijl
contextuele
modellen
uitgaan
van
lokale
normen.
of
verwijderd,
maar
soms
dragen
ze
waardevolle
informatie.
Transformeren
van
de
data
(bijvoorbeeld
logaritme
of
Box-Cox),
of
het
toepassen
van
robuuste
statistische
methoden
kan
ook
helpen.
In
alle
gevallen
vereist
interpretatie
domeinkennis
en
zorgvuldige
beoordeling
of
een
uitschieter
inderdaad
een
fout
is
of
een
betekenisvol
signaal.