Datakatalogien
Datakatalogien sind systematische Sammlungen von Metadaten über Datenbestände einer Organisation. Sie dienen der Entdeckung, dem Verständnis, der Nutzung und der Governance von Daten. In einem Datakatalog werden Informationen wie Herkunft der Daten, Datenquellen (Datenbanken, Data Lakes, Dateien), Datenstrukturen (Schemata, Tabellen, Felder), Eigentümerinnen und Eigentümer, Verantwortlichkeiten (Data Stewardship), Zugriffsrechte, Datenschutzklassifikationen, Nutzungsbedingungen sowie Qualitätskennzahlen erfasst.
Durchsuchbarkeit und Kontext ermöglichen Fach- und IT-Anwendern, passende Daten zu finden, deren Bedeutung nachzuvollziehen und Risiken
Datakatalogien unterscheiden sich je nach Einsatzgebiet in Typen wie explorative Kataloge für Data Discovery, systematische Kataloge
Herausforderungen umfassen die Qualität und Aktualität der Metadaten, die Skalierung bei großen Datenlandschaften, Harmonisierung von Metadatenquellen,