Home

Ausfallsicherheit

Ausfallsicherheit ist die Fähigkeit eines Systems, bei Störungen weiter zu funktionieren oder sich schnell wiederherzustellen. Sie zielt darauf ab, Betriebsbereitschaft und Integrität auch bei Teilausfällen zu gewährleisten. Der Begriff wird in IT, Industrieautomatisierung und kritischer Infrastruktur verwendet und wird oft synonym mit Verfügbarkeit oder Fault Tolerance verwendet, wobei unterschiedliche Kontexte bestehen.

Zentrale Designprinzipien umfassen Redundanz, Fehlererkennung, Isolierung von Fehlern, Fehlertoleranz, Wiederherstellung und kontinuierliche Überwachung. Redundanz kann physisch

Architekturen zur Ausfallsicherheit umfassen Failover-Cluster, Load Balancer, redundante Netzwerke und Datenreplikation. In verteilten Systemen kommen Muster

Messgrößen sind Verfügbarkeit (oft als Anteil der Betriebszeit), MTBF, MTTR und MTTF. Weitere Ziele sind Recovery

Ausfallsicherheit findet Anwendung in IT-Infrastruktur, Industrieautomation, Telekommunikation, Energieversorgung und Luft- bzw. Raumfahrt. International relevante Standards betreffen

Kosten, Komplexität und Wartungsaufwand steigen mit der gewünschten Verfügbarkeit. Eine vollständige Ausfallsicherheit ist oft unrealistisch; es

(duplizierte
Komponenten)
oder
logisch
(redundante
Datenpfade)
erfolgen.
Je
nach
Ausführung
unterscheidet
man
aktive
Redundanz
(gleiche
Funktion
läuft
parallel),
passiv
oder
warmes
Standby.
wie
Bulkheads,
Idempotenz,
Transaktionsprotokolle
und
regelmäßige
Konsistenzprüfungen
zum
Einsatz.
In
Software
können
Microservices
mit
Circuit
Breakern
und
Strategien
zur
graceful
degradation
helfen.
Time
Objective
(RTO)
und
Recovery
Point
Objective
(RPO).
Die
Bewertung
erfolgt
durch
Tests,
Stresstests,
Failover-Übungen
sowie
Root-Cause-Analysen.
Safety
und
Reliability,
z.
B.
IEC
61508/61511
und
ISO
26262;
in
der
IT
häufige
Rahmenwerke
wie
ITIL
oder
ISO/IEC
27001
zur
Systemstabilität.
wird
stattdessen
auf
verhältnismäßige
Redundanz
und
eine
degradierbare
Funktionalität
gesetzt.