Ausfallsicherheit
Ausfallsicherheit ist die Fähigkeit eines Systems, bei Störungen weiter zu funktionieren oder sich schnell wiederherzustellen. Sie zielt darauf ab, Betriebsbereitschaft und Integrität auch bei Teilausfällen zu gewährleisten. Der Begriff wird in IT, Industrieautomatisierung und kritischer Infrastruktur verwendet und wird oft synonym mit Verfügbarkeit oder Fault Tolerance verwendet, wobei unterschiedliche Kontexte bestehen.
Zentrale Designprinzipien umfassen Redundanz, Fehlererkennung, Isolierung von Fehlern, Fehlertoleranz, Wiederherstellung und kontinuierliche Überwachung. Redundanz kann physisch
Architekturen zur Ausfallsicherheit umfassen Failover-Cluster, Load Balancer, redundante Netzwerke und Datenreplikation. In verteilten Systemen kommen Muster
Messgrößen sind Verfügbarkeit (oft als Anteil der Betriebszeit), MTBF, MTTR und MTTF. Weitere Ziele sind Recovery
Ausfallsicherheit findet Anwendung in IT-Infrastruktur, Industrieautomation, Telekommunikation, Energieversorgung und Luft- bzw. Raumfahrt. International relevante Standards betreffen
Kosten, Komplexität und Wartungsaufwand steigen mit der gewünschten Verfügbarkeit. Eine vollständige Ausfallsicherheit ist oft unrealistisch; es