Ausreißer
Ausreißer bezeichnet eine Beobachtung, die sich signifikant von den übrigen Werten einer Stichprobe unterscheidet. In der Statistik wird damit ein Messwert beschrieben, der die typische Verteilung oder das Muster einer Datenmenge deutlich stört. Ausreißer können natürliche Varianz, Messfehler, Dateneingabefehler oder seltene Ereignisse widerspiegeln.
Ursachen reichen von Fehlern bei der Datenerhebung über Ungenauigkeiten in der Messung und Eingabe bis hin
Erkennungsmethoden umfassen visuelle Verfahren wie Boxplots oder Streudiagramme sowie numerische Kriterien. Zu den univariaten Kriterien gehören
Auswirkungen: Ausreißer können Mittelwert und Streuung verzerren und Parameter von Regressions- oder Zeitreihenmodellen beeinflussen. In manchen
Umgang: Zunächst Daten prüfen und ggf. Fehler korrigieren. Danach Optionen wie Transformation (z. B. Logarithmus), Winsorizing