virheenkestävyyteen
Virheenkestävyys tarkoittaa järjestelmän ominaisuutta säilyttää toiminta tai palautua vähäisin häiriöin vikoista tai virheistä huolimatta. Keskeinen tavoite on minimoida käyttökatkot ja tiedon menetykset sekä varmistaa käyttökelpoisuus kriittisissä tilanteissa. Virheenkestävyys eroaa pelkästä virheiden hallinnasta: se keskittyy järjestelmän kykyyn jatkaa toimintaa tai pehmentää vaikutuksia haastavissakin olosuhteissa.
Keskeiset periaatteet ovat redundanssi, eristys ja virheiden havaitseminen sekä korjaaminen. Redundanssi lisää järjestelmän kopiota tai varmuuskanavia,
Arkkitehtuurisesti virheenkestävyys toteutetaan usein hajautetuin ratkaisuin, kuten klusterit, load balancing, failover-mekanismit ja konttoriin tai mikropalveluihin perustuvat
Mittaaminen ja standardit huomioivat käytettävyyden (availability), MTBF:n, MTTR:n ja systeemin toleranssin. Virheenkestävyys on usein riippuvainen kustannuksista,