Datenherkunfts
Datenherkunft, auch als Datenherkunftsverlauf oder Provenienz von Daten bezeichnet, beschreibt die dokumentierte Geschichte von Daten: wo sie herkommen, wie sie erzeugt oder verändert wurden, wer sie bearbeitet hat und welche Transformationen sie durchlaufen haben. Ziel ist Transparenz und Nachvollziehbarkeit entlang des gesamten Datenlebenszyklus.
Provenienzdaten umfassen Quellen, Zeitstempel, beteiligte Akteure, Versionen, Transformationen, Abhängigkeiten und Bereitstellungsorte. Durch die Erfassung ermöglichen sie
Modelle und Standards: Provenanz kann durch Modelle wie das W3C PROV Data Model (PROV-DM) und PROV-O (OWL-Vokabular)
Anwendungen: Wissenschaftliche Forschung, Compliance- und Auditprozesse, regulatorische Anforderungen, Data Governance sowie die Entwicklung vertrauenswürdiger KI-Modelle, bei
Herausforderungen: Skalierbarkeit, Performance-Overhead, Datenschutzbedenken bei der Offenlegung sensibler Herkunftsinformationen, Widersprüche oder Unvollständigkeit der Provenienzdaten sowie Standardisierung
Datenherkunft ist ein zentrales Element moderner Data Governance, das Organisationen hilft, Transparenz, Verantwortlichkeit und Qualität sicherzustellen.