Systemüberwachung
Systemüberwachung bezeichnet die kontinuierliche Erfassung, Auswertung und Visualisierung von Zuständen in IT-Infrastrukturen zur Gewährleistung von Leistungsfähigkeit, Verfügbarkeit und Sicherheit. Sie umfasst Hardware, Betriebssysteme, Netzwerke, Anwendungen und Dienste. Ziel ist es, Störungen frühzeitig zu erkennen, Engpässe zu identifizieren und Ausfälle zu vermeiden.
Zu den typischen Aufgaben gehören die Erfassung von Metriken, Logging, Alarmmanagement, Trend- und Kapazitätsplanung sowie Sicherheitsüberwachung.
Die Architektur kann agentenbasiert oder agentenlos sein. Agenten sammeln Messdaten lokal und übertragen sie zentral, während
Wesentliche Bereiche der Systemüberwachung sind Infrastrukturüberwachung, Anwendungsüberwachung (End-to-End), Netzüberwachung sowie Sicherheits- und Compliance-Überwachung. In der Praxis
Typische Metriken umfassen CPU- und Speichernutzung, Arbeitsspeicher, Festplatten-I/O, Netzwerkauslastung, Prozessstatus, Antwortzeiten und Fehlerraten. Dazu kommen Umweltparameter
Technische Mittel und Standards umfassen Protokolle und Technologien wie SNMP, WMI, NetFlow, sFlow, syslog sowie OpenTelemetry