fejlrobusthed
Fejlrobusthed er evnen for et system til at opretholde væsentlig funktionalitet under fejl eller uventede tilstande og at begrænse konsekvenserne af fejl til et mindst muligt omfang. Begrebet dækker software, hardware og integrerede systemer og omfatter mekanismer til fejldetektion, fejlhåndtering og recovery. Fejlrobusthed supplerer andre kvaliteter som ydeevne og sikkerhed og fokuserer særligt på kontinuitet og stabil brugeroplevelse i fejlfulde situationer.
Nøgleprincipper inkluderer isolering af komponenter, redundans, fejldetektion og containment, samt hurtig og kontrolleret recovery. Målene er
Designtilgange og mønstre omfatter defensiv programmering, inputvalidering, fail-safe standarder, idempotente operationer og transaktionel integritet. Redundans kan
Vigtige målinger inkluderer tilgængelighed, MTBF (mean time between failures) og MTTR (mean time to repair), fejlrater
Anvendelse omfatter kritiske infrastrukturer, cloud-tjenester, databaser og autonome systemer. Implementeringen kræver afvejning mellem robusthed, ydeevne, omkostninger