Home

failovermekanismer

Failovermekanismer er systemer og prosesser som sikrer høy tilgjengelighet ved å overføre betjening eller data til en erstatningskomponent ved feil eller svikt. Hovedmålet er å minimere nedetid og bevare kontinuitet i tjenesten. Vanlige komponenter inkluderer overvåking av helse, beslutningslogikk og utførelse av en volumsatt handlingsrekkefølge for å bytte til en fungerende ressurs.

Overvåking og beslutning skjer ofte gjennom helsesjekker, hjerterytmesignaler (heartbeat), tidsavbrudd og statusmeldinger. Når en feil oppdages,

Typisk deles failover i aktive modeller som active-passive, hvor en primær enhet håndterer, og en eller flere

Planlegging inkluderer ofte mål for tilgjengelighet, kalt Recovery Point Objective (RPO) og Recovery Time Objective (RTO),

avgjøres
det
automatisk
eller
manuelt
hvilken
ressurs
som
skal
overta.
Utførelsen
innebærer
å
ta
ned
den
feilede
enheten
på
en
kontrollert
måte
og
gjøre
den
erstatningsenheten
aktiv,
samt
å
omdirigere
trafikk
eller
dataflyt.
standby-enheter
tar
over
ved
feil;
og
active-active,
der
flere
enheter
håndterer
trafikk
samtidig
og
kan
bytte
belastning
ved
behov.
Failover
kan
være
implementert
på
ulike
nivåer:
maskinvare,
programvare,
nettverk,
lagring
og
applikasjonslogikk.
Kjente
mekanismer
inkluderer
redundante
noder,
klustere,
replikering,
og
koordinering
med
domenepåføring
eller
DNS-/IP-failover.
samt
redundansnivåer
som
N+1.
Testing
med
jevnlige
failover-øvelser
og
risikoanalyse
(for
eksempel
split-brain
og
falske
alarmer)
er
viktig
for
å
opprettholde
effektive
mekanismer.