Home

Residualanalyse

Residualanalyse, in der Statistik auch Residualdiagnostik, bezeichnet die Untersuchung der Residuen eines Regressionsmodells, also der Differenzen zwischen beobachteten Werten y_i und den vom Modell vorhergesagten Werten ŷ_i. Ziel ist es, die Plausibilität der Modellannahmen zu prüfen, die Qualität der Vorhersagen zu bewerten und potenzielle Probleme wie Nichtlinearität, Heteroskedastizität oder Ausreißer zu identifizieren.

Typische Residuenarten sind rohe Residuen, standardisierte Residuen und studentisierte Residuen. Die zentrale Annahme in der klassischen

Zur Identifikation einflussreicher Beobachtungen dienen Kennzahlen wie Cook’s Distances, Hebelwirkung (Leverage) und DFBETAs. Beobachtungen mit großem

In Zeitreihenmodellen muss besonderes Augenmerk auf Autokorrelation liegen; Residuen sollten nicht systematisch korreliert sein. Residualanalyse ist

linearen
Regression
ist,
dass
die
Residuen
unabhängig,
identisch
normalverteilt
mit
Erwartungswert
0
und
konstanter
Varianz
σ^2
sind.
Die
Überprüfung
erfolgt
oft
über
Residuenplots:
Residuen
gegen
die
vorhergesagten
Werte
oder
gegen
eine
unabhängige
Variable
(zur
Beurteilung
von
Linearität
und
Varianz),
QQ-Plots
zur
Normalität,
und
hinweisende
Muster
deuten
auf
Modellmängel
hin.
Zusätzlich
können
formale
Tests
eingesetzt
werden:
Shapiro-Wilk
für
Normalität,
Breusch-Pagan
oder
White
für
Heteroskedastizität,
Durbin-Watson
oder
Ljung-Box
für
Unabhängigkeit.
Einfluss
können
Modellvalidität
beeinflussen.
Bei
Feststellung
von
Problemen
können
Transformationen
(z.
B.
Box-Cox),
das
Hinzufügen
von
Variablen,
Interaktionen
oder
die
Verwendung
robusterer
Methoden
Abhilfe
schaffen.
damit
ein
zentrales
Diagnostikinstrument,
das
keine
endgültige
Modellwahl
ersetzt,
aber
die
Evidenzbasis
stärkt.