virheenkestokyky
Virheenkestokyky, joskus viitataan sanalla virheenkestävyys, on järjestelmän ominaisuus, jonka avulla se pystyy jatkamaan toimintaa virhetilanteissa tai palauttamaan toimintansa hallitusti nopeasti. Tavoitteena on minimoida käyttökatkot ja varmistaa kriittisten toimintojen jatkuvuus. Virheenkestokykyyn liittyy sekä virheiden havaitsemista ja eristämistä että järjestelmän palautumiskykyä häiriöiden jälkeen.
Keskeisiä keinoja ovat redundanssi: useiden samanlaisten komponenttien, polkujen tai palvelinten käyttö sekä varmistettu tallennusvaihtoehto, kuten RAID-
Mittareita ovat käytettävyys (availability), eli järjestelmän kokonaishäiriöttömyys prosentteina, sekä MTBF (keskimääräinen vikaantumisaika) ja MTTR (keskimääräinen vian
Esimerkkejä virheenkestokyvyn sovelluksista ovat RAID-levyjärjestelmät, ECC-muisti sekä kaksinkertaiset virtalähteet ja verkkoyhteydet. Hajautetuissa järjestelmissä klusterointi, kuormituksenjakaminen ja