Home

fouttolerantie

Fouttolerantie is het vermogen van een systeem om door te blijven functioneren, ook als een of meerdere onderdelen uitvallen. Het doel is beschikbaarheid en betrouwbaarheid waarborgen, mogelijk met degradatie naar een beperkte functionaliteit in plaats van een volledige fout. Fouttolerantie gaat vaak verder dan foutbestendigheid door continuïteit te garanderen ondanks storingen.

Methoden en concepten

- Hardwarematige redundantie: meerdere componenten die elkaar kunnen overnemen, zoals redundante voedingen, dubbele systemen, RAID-systemen en meerdere

- Foutdetectie en -correctie: checksums, pariteit, error-correcting codes (ECC) en andere mechanismen om fouten te detecteren en

- Failover en replicatie: automatische overschakeling naar een stand-by systeem, replicatie van data over locaties en continue

- Gedistribueerde systemen: consensusprotocollen en quorummechanismen (zoals Paxos, Raft) om onafhankelijk van elkaar werkende knooppunten te laten

- Softwarematige benaderingen: retry-logica, circuit breakers en degradeerde functionaliteit (graceful degradation) om essentiële taken operationeel te houden.

Toepassingsgebieden

Gebruikt in bedrijfsservers, netwerkinfrastructuur, opslagoplossingen, kritieke infrastructuren, en in veiligheid-georiënteerde systemen zoals avionica en automotive-elektronica.

Prestatie-indicatoren en afwegingen

Beschikbaarheid, MTBF, MTTR, RTO en RPO geven de prestaties van fouttolerante systemen weer. Fouttolerantie brengt kosten,

---

netwerkverbindingen.
waar
mogelijk
te
herstellen.
beschikbaarheid.
samenwerken
en
consistente
resultaten
te
leveren;
erasure
coding
als
alternatief
voor
eenvoudige
replicatie.
complexiteit
en
mogelijke
prestatielasten
met
zich
mee;
ontwerpafwegingen
moeten
afwegen
tussen
snelheid,
consistentie
en
veerkracht,
vooral
in
gedistribueerde
omgevingen
zoals
CAP-theorie
beschrijft.