Home

Fehlertoleranzen

Fehlertoleranzen bezeichnet die Fähigkeit eines Systems, auch bei Ausfällen einzelner Bauteile oder Funktionen weiterhin funktionsfähig zu bleiben. Sie zielt darauf ab, Verfügbarkeit, Sicherheit und Robustheit zu gewährleisten, insbesondere in sicherheits- oder schwerwiegenden kritischen Anwendungen.

Durch technische Maßnahmen und organisatorische Konzepte werden Fehler erkannt, isoliert und bei Bedarf kompensiert oder repariert.

Typische Architekturen umfassen Triple Modular Redundancy (TMR), Abstimmung/Nachweis (Voting), ECC-Speicher, RAID-Systeme sowie Fail-Over-Strategien. Es wird unterschieden

Anwendungen finden sich in der IT-Infrastruktur, Telekommunikation, Flug- und Raumfahrt, Automobiltechnik, Medizintechnik und Industrieautomation. Normen und

Grenzen bestehen durch Kosten, Gewicht, Energiebedarf und Komplexität; nicht jedes System braucht hohe Fehlertoleranz. Ziel ist

Zentrale
Prinzipien
sind
Redundanz
(duplizierte
oder
triplete
Komponenten),
Fehlererkennung
und
-diagnose,
Isolation
fehlerhafter
Teile
sowie
Recovery-
oder
Reconfigurations-Mechanismen.
Informations-
und
zeitliche
Redundanz,
etwa
durch
Fehlerkorrekturcodes
oder
Wiederholungen,
ergänzen
die
physische
Redundanz.
zwischen
passiver
Fehlertoleranz
(System
bleibt
stabil,
obwohl
Teile
ausfallen)
und
aktiver
Fehlertoleranz
(das
System
setzt
trotz
Ausfall
fort,
oft
durch
Umschaltlogik).
Von
Bedeutung
ist
außerdem
eine
kontrollierte,
graduelle
Absenkung
der
Leistung
oder
Funktionalität
(graceful
degradation).
Standards
wie
ISO
26262,
DO-178C
oder
IEC
61508
liefern
Anforderungen
an
Fehlertoleranz
in
sicherheitsrelevanten
Systemen.
ein
ausgewogenes
Verhältnis
zwischen
Sicherheitsniveau,
Leistungsfähigkeit
und
Wirtschaftlichkeit.