Fehlerbudgetierung
Fehlerbudgetierung ist ein Konzept aus der Site Reliability Engineering (SRE), das darauf abzielt, Zuverlässigkeit und Entwicklungsgeschwindigkeit auszubalancieren, indem eine quantitative Grenze für die zulässige Fehleranzahl bzw. Ausfallzeit festgelegt wird. Grundlage sind Service-Level-Objektive (SLOs) und Service-Level-Indikatoren (SLIs). Ein SLO definiert das gewünschte Maß an Zuverlässigkeit (z. B. Verfügbarkeit, Latenz), während das SLI das tatsächliche Maß misst. Das Fehlerbudget gibt an, wie viel Unzuverlässigkeit im definierten Zeitraum akzeptiert wird, bevor das SLO verletzt gilt.
Die Berechnung erfolgt typischerweise als Verhältnis der nicht erfüllten Zuverlässigkeitsziele: Fehlerbudget = (1 - SLO) × Zeitraum. Beispiel:
Anwendung: Teams überwachen das Fehlerbudget, um Release-Entscheidungen zu lenken. Bei hohem Budgetverbrauch können zusätzliche Sicherheitsmechanismen greifen,
Vorteile und Einschränkungen: Zu den Vorteilen gehören eine transparente Balance zwischen Zuverlässigkeit und Geschwindigkeit, bessere Priorisierung