Home

Ausreißer

Ausreißer bezeichnet eine Beobachtung, die sich signifikant von den übrigen Werten einer Stichprobe unterscheidet. In der Statistik wird damit ein Messwert beschrieben, der die typische Verteilung oder das Muster einer Datenmenge deutlich stört. Ausreißer können natürliche Varianz, Messfehler, Dateneingabefehler oder seltene Ereignisse widerspiegeln.

Ursachen reichen von Fehlern bei der Datenerhebung über Ungenauigkeiten in der Messung und Eingabe bis hin

Erkennungsmethoden umfassen visuelle Verfahren wie Boxplots oder Streudiagramme sowie numerische Kriterien. Zu den univariaten Kriterien gehören

Auswirkungen: Ausreißer können Mittelwert und Streuung verzerren und Parameter von Regressions- oder Zeitreihenmodellen beeinflussen. In manchen

Umgang: Zunächst Daten prüfen und ggf. Fehler korrigieren. Danach Optionen wie Transformation (z. B. Logarithmus), Winsorizing

zu
Heterogenität
der
untersuchten
Population
oder
echten
Extremereignissen.
Man
unterscheidet
globale
Ausreißer,
die
weit
außerhalb
der
Verteilung
liegen,
sowie
kontextuelle
oder
kollektive
Ausreißer,
die
im
relevanten
Umfeld
auffallen.
der
z-Score
und
die
IQR-Methode:
Werte
außerhalb
von
1,5-mal
dem
Interquartilsabstand
gelten
als
potenzielle
Ausreißer.
Multivariate
Ansätze
nutzen
Distanzmaße
wie
die
Mahalanobis-Distanz
oder
robuste
Verfahren
wie
clusteringbasierte
Ansätze,
um
Ausreißer
in
mehrdimensionalen
Daten
zu
identifizieren.
Fällen
liefern
sie
jedoch
auch
informative
Hinweise.
Die
Entscheidung,
ob
man
sie
entfernt,
transformiert
oder
robuste
Modelle
verwendet,
hängt
vom
Kontext
ab.
oder
robuste
Statistiken
bzw.
robuste
Regression
einsetzen.
In
Zeitreihen
können
Ausreißer
als
strukturelle
Brüche
modelliert
werden.
In
der
Alltagssprache
kann
der
Begriff
auch
eine
Person
bezeichnen,
die
entkommen
ist;
der
Schwerpunkt
dieser
Darstellung
liegt
jedoch
auf
der
statistischen
Bedeutung.