Plattformausfälle
Plattformausfälle bezeichnen Unterbrechungen der Verfügbarkeit einer technischen Plattform, etwa eines Webportals, einer Cloud-Plattform oder einer Geschäftsanwendung. Typisch umfasst ein Ausfall die vollständige oder teilweise Nichterreichbarkeit der Dienste für Nutzer über verschiedene Kanäle; die Dauer reicht von Minuten bis zu mehreren Stunden.
Ursachen: Technische Fehler in Software oder Hardware; fehlerhafte Konfigurationen; geplante Wartung oder Updates; Abhängigkeiten von Drittsystemen
Arten: Vollausfall, Teil- oder Leistungsabfall; redundante Systeme und Failover können Ausfälle begrenzen; geografisch verteilte Infrastrukturen; Failover-
Auswirkungen: Beeinträchtigung für Endnutzer, Geschäftsprozesse, Umsatzverluste; Auswirkungen auf Compliance und Kundenzufriedenheit; Kosten für Wiederherstellung, forensische Analysen.
Prävention und Reaktion: Architekturprinzipien wie Redundanz, Lastverteilung, regelmäßige Backups, Monitoring, automatisierte Alarmierung; klare Incident-Management-Prozesse; Notfallpläne, Kommunikationsstrategien
Messung und Standards: Verfügbarkeit wird oft als Anteil der Betriebszeit definiert (uptime); SLA-Vorgaben legen Zielwerte fest;