Datengüte
Datengüte bezeichnet die Gesamtheit der Eigenschaften von Daten, die ihre Eignung für festgelegte Verwendungszwecke bestimmen. Sie beeinflusst Genauigkeit, Vollständigkeit, Konsistenz, Aktualität, Validität, Eindeutigkeit und Integrität und ist maßgeblich für verlässliche Analysen, Berichte und regulatorische Compliance.
Zu den zentralen Qualitätsdimensionen gehören:
- Genauigkeit: Abbildung der realen Werte.
- Vollständigkeit: Erfassung aller relevanten Felder.
- Konsistenz: Widerspruchsfreiheit über Systeme hinweg.
- Aktualität: zeitnahe Verfügbarkeit.
- Validität: Einhaltung von Formaten und Definitionsbereichen.
- Eindeutigkeit: Vermeidung doppelter Datensätze.
- Integrität: korrekte Beziehungen zwischen Datensätzen.
Messung und Verbesserung erfolgen durch Datenprofiling, Plausibilitätsprüfungen, Validierungsregeln, Bereinigung, Deduplication und Data-Cleansing. Wichtige Kennzahlen sind Fehlerrate,
Governance und Organisation legen Verantwortlichkeiten fest (Data Owner, Data Steward), definieren Qualitätsziele, Regeln und Eskalationen, und
Standards und Rahmenwerke umfassen ISO 8000, ISO 25012, DAMA-DMBOK und DCAM; sie liefern Methoden zur Bewertung,
Bedeutung: Gute Datengüte ist Grundvoraussetzung für valide Entscheidungen, effiziente Prozesse und Risikominimierung. Herausforderungen ergeben sich aus