fouttolerantie
Fouttolerantie is het vermogen van een systeem om door te blijven functioneren, ook als een of meerdere onderdelen uitvallen. Het doel is beschikbaarheid en betrouwbaarheid waarborgen, mogelijk met degradatie naar een beperkte functionaliteit in plaats van een volledige fout. Fouttolerantie gaat vaak verder dan foutbestendigheid door continuïteit te garanderen ondanks storingen.
- Hardwarematige redundantie: meerdere componenten die elkaar kunnen overnemen, zoals redundante voedingen, dubbele systemen, RAID-systemen en meerdere
- Foutdetectie en -correctie: checksums, pariteit, error-correcting codes (ECC) en andere mechanismen om fouten te detecteren en
- Failover en replicatie: automatische overschakeling naar een stand-by systeem, replicatie van data over locaties en continue
- Gedistribueerde systemen: consensusprotocollen en quorummechanismen (zoals Paxos, Raft) om onafhankelijk van elkaar werkende knooppunten te laten
- Softwarematige benaderingen: retry-logica, circuit breakers en degradeerde functionaliteit (graceful degradation) om essentiële taken operationeel te houden.
Gebruikt in bedrijfsservers, netwerkinfrastructuur, opslagoplossingen, kritieke infrastructuren, en in veiligheid-georiënteerde systemen zoals avionica en automotive-elektronica.
Prestatie-indicatoren en afwegingen
Beschikbaarheid, MTBF, MTTR, RTO en RPO geven de prestaties van fouttolerante systemen weer. Fouttolerantie brengt kosten,
---