Home

Kaskadenfehler

Der Begriff Kaskadenfehler beschreibt einen Fehlerverlauf, bei dem eine Störung in einer Komponente unerwartet weitere Störungen in abgeleiteten oder verbundenen Komponenten verursacht, sodass sich der Fehler schrittweise durch das System ausbreitet. Typisch entstehen Kaskadenfehler in hochgradig vernetzten oder zeitabhängigen Systemen, in denen Teilsysteme aufeinander angewiesen sind oder Ressourcen gemeinsam nutzen.

Ursachen sind Abhängigkeiten, Software- oder Systemgrenzen, ungenügende Fehlertoleranz, verzögerte Fehlererkennung, Race Conditions, gemeinsame Engpässe oder unkontrollierte

Anwendungsbereiche: in der IT und Netzwerkinfrastruktur, in Energiesystemen und Versorgungsnetzen, in Fertigungs- oder Logistikprozessen, sowie in

Beispiele: Ausfall eines Kraftwerkstrangs kann zu Überlastungen anderer Leitungen führen und eine landesweite Stromunterbrechung auslösen; in

Gegenmaßnahmen zielen auf Fehlerisolierung, Redundanz und Entkopplung: robuste Architekturen mit Grenzwerten (Circuit Breaker), Grenz- und Fallback-Strategien,

Der Begriff wird in Reliability Engineering, Safety Engineering und Risikoanalysen verwendet.

Zustandsweitergabe.
Bereits
ein
vorheriger
Fehler
muss
nicht
schwerwiegend
sein;
durch
Koppelungen,
Verzögerungen
oder
begrenzte
Backups
kann
er
zu
einer
dynamischen
Ausbreitung
führen.
Kaskaden
können
sich
über
Hardware,
Software,
Netzwerke
oder
organisatorische
Prozesse
erstrecken.
Finanz-
und
Handelsmärkten,
wo
Ausfälle
oder
Fehlzustände
reibungslos
weitergegeben
werden.
verteilten
Softwaresystemen
kann
eine
unbehandelte
Ausnahme
den
Zustand
aller
Dienste
verschlechtern;
in
Cloud-Umgebungen
kann
eine
Fehlkonfiguration
zu
einer
Kaskade
von
Serviceunterbrechungen
führen.
Degradierung
statt
Ausfall,
zeitnahe
Fehlererkennung,
isolierte
Ressourcennutzung,
Monitoring
und
Testen
von
Ausfallpfaden.