Home

Ausreißern

Ausreißer bezeichnet man in der Statistik Beobachtungen, die sich deutlich von den übrigen Messwerten einer Stichprobe oder Population unterscheiden. Solche Werte können echte Merkmale einer heterogenen Population widerspiegeln, aber auch Folge von Messfehlern, Dateneingabefehlern oder Datenverarbeitungsfehlern sein. Sie können Analysen verzerren und zu falschen Schlussfolgerungen führen, weshalb ihr Vorhandensein sorgfältig bewertet wird.

Ausreißer lassen sich in univariate und multivariate Ausreißer unterscheiden. Ein univariater Ausreißer liegt in einer einzelnen

Erkennung erfolgt oft grafisch oder anhand von Kennzahlen. Häufige Methoden sind Boxplots mit dem Interquartilsabstand (IQR)

Umgang: Nach Prüfung der Ursache können Ausreißer korrigiert, transformiert, Winsorisiert oder aus der Analyse ausgeschlossen werden.

Variable
deutlich
außerhalb
des
Wertebereichs
der
übrigen
Daten,
während
ein
multivariater
Ausreißer
in
einer
ungewöhnlichen
Kombination
mehrerer
Variablenwerte
besteht,
auch
wenn
einzelne
Variablenwerte
für
sich
genommen
nicht
extrem
sind.
und
Tukeys
Fence,
bei
denen
Werte
außerhalb
eines
bestimmten
Bereichs
als
potenzielle
Ausreißer
gelten.
Standardisierte
Abstände
wie
Z-Scores
über
±3
werden
ebenfalls
verwendet.
Ergänzend
kommen
statistische
Tests
wie
Grubbs’
Test
oder
Dixon’s
Q-Test
zum
Einsatz,
insbesondere
bei
normalverteilten
oder
kleinen
Stichproben.
Robuste
Verfahren
wie
Median,
MAD
(Median
Absolute
Deviation)
oder
robuste
Regression
helfen,
Ausreißer
zu
mildern,
ohne
sie
zu
eliminieren.
In
vielen
Kontexten
kann
auch
eine
robuste
statistische
Methodik
oder
eine
Datenmodellierung,
die
Ausreißer
weniger
empfindlich
macht,
sinnvoll
sein.
Der
konkrete
Umgang
hängt
von
der
Fragestellung,
der
Stichprobengröße
und
der
Datenqualität
ab.