Home

Fehlwerten

Fehlwerten bezeichnet in der Statistik fehlende Messwerte in einem Datensatz. Sie treten auf, wenn für eine Beobachtung eine Variable keinen gemessenen Wert hat. Fehlwerte unterscheiden sich von gültigen Werten wie Null oder leeren Feldern, die unterschiedliche Bedeutungen haben. Im Alltag erscheinen sie häufig in Umfragedaten, Experimenten, Sensor- oder Protokolldaten.

Ursachen und Muster: Häufige Ursachen sind Nichtantwort, Messfehler, das Überspringen von Feldern, Datenübertragungsfehler oder technische Ausfälle.

Auswirkungen: Fehlwerte reduzieren die verfügbare Stichprobenanzahl und können Verzerrungen verursachen, wenn das Missingness nicht zufällig ist.

Umgang: Möglichkeiten umfassen Löschung fehlender Werte (listwise oder pairwise), sowie Imputation. Einfache Verfahren: Ersetzung durch Mittelwert/Median;

Dokumentation und Qualitätssicherung: Berichte über Anteil und Verteilung der Fehlwerte, Transparenz über Imputationen und Sensitivitätsanalysen sind

Muster
der
Fehlwerte
lassen
sich
in
MCAR
(fehlende
Werte
unabhängig
von
allen
Variablen),
MAR
(abhängig
von
beobachteten
Variablen)
und
MNAR
(abhängig
von
nicht
beobachteten
Werten)
unterscheiden.
Die
Typen
haben
Einfluss
auf
die
geeignete
Analyse.
Besonders
in
Zeitreihen
oder
Längsschnitten
können
Lücken
Analysen
komplizieren.
fortgeschrittene
Ansätze:
Regression,
Hot-Deck-Imputation,
KNN-Imputation.
Mehrfachimputation
(Multiple
Imputation)
kombiniert
mehrere
plausible
Werte.
Modellbasierte
Ansätze
wie
Maximum-Likelihood
oder
Bayesian
Methods
sind
ebenfalls
gängig.
Die
Wahl
hängt
von
Missingness-Typ,
Verzerrungspotenzial
und
Analyseziel
ab.
wichtig.
Fehlwerte
werden
oft
als
NA,
NaN
oder
leere
Felder
kodiert;
eine
konsistente
Dokumentation
erleichtert
Reproduzierbarkeit.