Home

Datenkatalog

Ein Datenkatalog ist eine zentrale Sammlung von Metadaten über Datenressourcen einer Organisation. Er dient dazu, Datenbestände sichtbar zu machen, deren Bedeutung zu klären und den Umgang mit Daten zu steuern. Ziel ist eine bessere Auffindbarkeit, Verständlichkeit und Wiederverwendbarkeit von Daten.

Durch die Erfassung von Metadaten unterstützt ein Datenkatalog Data Governance, Datenqualität, Compliance und Risikomanagement. Er erleichtert

Zu den Kernbestandteilen gehören Metadaten zu Datenobjekten (Tabellen, Spalten, Datentypen, Herkunft), Datenlinien (Lineage), Berechtigungen und Eigentümerschaften,

An einem Datenkatalog arbeiten typischerweise Data Engineers, Data Scientists, Business Analysts sowie Data Stewards und Data

Technisch integriert sich ein Datenkatalog mit Repositorien, Data Warehouses, Data Lakes und Integrationswerkzeugen. Er bietet Suchfunktionen,

Zu den Herausforderungen gehören die Pflege der Metadaten, Vollständigkeit und Qualität der Informationen, Akzeptanz im Unternehmen

die
Suche
nach
relevanten
Daten,
die
Nachvollziehbarkeit
von
Herkunft
und
Verarbeitung
sowie
die
Zuweisung
von
Verantwortlichkeiten
für
Datenassets.
Business
Glossar
und
Taxonomien,
Qualitätsindikatoren,
Datenklassifikationen
und
Datenschutzkennzeichnungen
sowie
Versionierung
und
Lebenszyklusinformationen.
Owners.
Er
unterstützt
Kollaboration,
Richtlinienumsetzung
und
Compliance,
indem
er
Verantwortlichkeiten
und
Freigaben
sichtbar
macht.
Metadaten-Glossare,
APIs
und
Schnittstellen
zu
Automatisierungsprozessen.
Prinzipien
wie
DCAT-
oder
schema.org-basierte
Modelle
fördern
Interoperabilität
und
den
Austausch
von
Metadaten.
sowie
der
Schutz
sensibler
Daten.
Eine
erfolgreiche
Nutzung
setzt
ein
Governance-Modell,
klare
Rollen
und
regelmäßige
Aktualisierung
voraus.
Siehe
auch:
Data
Governance,
Metadatenmanagement.