Datenqualität
Datenqualität bezeichnet die Eigenschaft von Daten, verlässlich und sinnvoll für bestimmte Verwendungszwecke zu sein. Sie hängt vom Kontext ab und umfasst Merkmale wie Genauigkeit, Vollständigkeit und Aktualität, die entscheiden, ob Daten für Analyse, operative Prozesse oder Berichterstattung geeignet sind.
Zu zentralen Dimensionen der Datenqualität zählen Genauigkeit, Vollständigkeit, Aktualität, Konsistenz, Validität und Eindeutigkeit. Ergänzend können Relevanz
Die Bewertung erfolgt durch Datenprofiling, Qualitätsregeln und Kennzahlen. Typische Messgrößen sind Fehlerquoten, Abdeckungsgrade, Dublettenraten, Timeliness, Validierungsrate
Datenqualität wird durch Daten governance und Data Stewardship adressiert. Organisatorisch verankerte Verantwortlichkeiten, klare Eigentümerrollen und dokumentierte
Zu den Maßnahmen gehören Bereinigung, Standardisierung, Validierung, Deduplication, Enrichment und das Etablieren von Data Lineage. Master
Der Datenqualitätslebenszyklus umfasst Profiling, Bereinigung, Anreicherung, Validierung, Monitoring und Remediation. Kontinuierliche Überwachung ermöglicht Abweichungen früh zu
Herausforderungen ergeben sich aus heterogenen Datenquellen, unklarem Verantwortungsbereich, Kosten- und Ressourcendruck, Datenschutzanforderungen sowie aus unvollständigen Metadaten.
Standards und Rahmenwerke wie ISO 8000 und DAMA-DMBOK geben Orientierung für Strategien, Kennzahlen und Prozesse zur
Gute Datenqualität erhöht die Zuverlässigkeit von Analysen, unterstützt effektive Geschäftsprozesse, reduziert Risiken und steigert den Wert