feilhåndtering
Feilhåndtering er prosessen der feil i systemer og programvare identifiseres, behandles og begrenses for å opprettholde funksjonalitet, tilgjengelighet og sikkerhet. Begrepet inkluderer både programvarefeil, maskinvarefeil, nettverksproblemer og feil i eksterne avhengigheter. Målet er å redusere skadeomfanget, oppdage feil tidlig og gi brukeren meningsfulle tilbakemeldinger.
Hovedprinsippene er forebygging, isolasjon og rask gjenoppretting. Forebygging innebærer defensiv programmering og klare grensesnitt; isolasjon innebærer
Teknikker inkluderer feilhåndtering i koden (unntak), bruk av feilkoder, tidsavbrudd, automatiske forsøk med tilbakekobling (backoff), circuit
Praktisk implementering består av omfattende overvåking, loggføring og distribuerte sporingsverktøy for distribuert system, samt innsamling av