Home

Hochverfügbarkeitsclustern

Hochverfügbarkeit bezeichnet die Fähigkeit eines Systems, eine Dienstleistung über längere Zeit hinweg mit minimaler Ausfallzeit bereitzustellen. Typische Zielgrößen sind Betriebszeitanteile wie 99,9 %, 99,99 % oder 99,999 %. Die Verfügbarkeit wird durch Metriken wie Ausfallzeiten, uptime und service-level-indicators gemessen und oft durch RPO (Recovery Point Objective) und RTO (Recovery Time Objective) definiert.

Wichtige Bausteine sind redundante Komponenten, Georedundanz, Failover-Mechanismen, Lastverteilung, Replikation von Daten und Systeme, regelmäßige Backups und

Architekturtypen umfassen aktiv-aktiv (mehrere Standorte arbeiten gleichzeitig) und aktiv-passiv (einer übernimmt bei Ausfall), oft mit Georedundanz

Die Verfügbarkeit wird durch regelmäßige Überwachung, Tests, Failover-Übungen und Dokumentation sichergestellt. Sie ist eng verbunden mit

ein
geplanter
Notfallwiederherstellungsplan.
Redundanzen
können
hardwareseitig
(Server,
Speicher,
Netzteile),
softwareseitig
(Clustering,
Load
Balancer)
oder
infrastrukturell
(mehrere
Rechenzentren,
Cloud-Regionen)
umgesetzt
werden.
Replikation
kann
synchron
oder
asynchron
erfolgen,
je
nach
Anforderungen
an
Konsistenz
und
Latenz.
und
automatischem
Failover.
In
Cloud-
und
Container-Umgebungen
kommen
Orchestrierung
(z.
B.
Kubernetes)
und
Microservices-Architekturen
zum
Einsatz,
um
Ausfallteile
isoliert
abzudecken.
Service-Level-Agreements
(SLAs)
sowie
SLI/SLOs.
Hochverfügbarkeit
ist
nicht
gleich
Disaster
Recovery;
erstere
zielt
auf
minimierte
Betriebsunterbrechungen
im
Normalbetrieb,
letztere
auf
die
Wiederherstellung
nach
größeren
Zwischenfällen.