Home

FailoverFähigkeit

FailoverFähigkeit bezeichnet die Fähigkeit eines Systems, bei Ausfall einzelner Komponenten automatisch oder manuell auf eine redundante Funktionseinheit umzuschalten, um den Betrieb fortzusetzen und Ausfallzeiten zu minimieren. In der Praxis ist sie Bestandteil der Hochverfügbarkeit (HA) und eng verbunden mit Backup- und Disaster-Recovery-Strategien. Wichtige Kennzahlen sind der Recovery Time Objective (RTO) und der Recovery Point Objective (RPO).

FailoverFähigkeit kann automatisch oder manuell erfolgen, aktiv oder passiv. Automatisches Failover wechselt ohne menschliches Eingreifen, typischerweise

Technisch umgesetzt wird FailoverFähigkeit durch Clustering, Replikation und Shared-Storage-Architekturen. Typische Muster sind Cluster mit Heartbeat- oder

Herausforderungen sind etwa Split-Brain-Situationen, Replikationslatenz, Dateninkonsistenzen, falsche Gesundheitsprüfungen und das Testen von Failover-Szenarien ohne Risiko für

FailoverFähigkeit ist entscheidend für Dienste mit hohen Verfügbarkeitsanforderungen wie Finanztransaktionen, Web-Dienste oder Speichersysteme. Eine gute Strategie

bei
erkanntem
Systemausfall.
Manuelles
Failover
erfolgt
durch
Bediener.
Systeme
können
single-site
oder
multi-site
ausgelegt
sein,
um
geografische
Redundanz
sicherzustellen.
Quorum-Mechanismen,
synchrone
oder
asynchrone
Replikation,
Failover-Manager,
Load
Balancer,
virtuelle
IP-Adressen.
Bekannte
Umsetzungen
umfassen
Windows
Server
Failover
Clustering
(WSFC),
Pacemaker/Corosync
auf
Linux,
sowie
Datenbanklösungen
wie
PostgreSQL
mit
Streaming-Replikation,
MySQL
Group
Replication
oder
SQL
Server
Always
On.
In
der
Cloud
kommen
Multi-AZ-
oder
Multi-Region-Ansätze
sowie
DNS-/Load-Balancer-basierte
Failovers
hinzu.
Produktionsdaten.
Die
Wahl
zwischen
synchroner
und
asynchroner
Replikation
beeinflusst
RPO/RTO,
Konsistenz
und
Komplexität.
kombiniert
automatische
Failovermechanismen,
regelmäßige
Tests,
klare
Failover-
und
Wiederherstellungsprozesse
sowie
Monitoring
und
Auditing.