ETLProzesse
ETLProzesse bezeichnet die Abfolge von Extract, Transform, Load, die verwendet wird, um Daten aus unterschiedlichen Quellsystemen zu sammeln, zu bereinigen und in ein Zielsystem wie ein Data Warehouse oder einen Data Lake zu überführen. Ziel ist es, konsistente, qualitativ hochwertige Daten für Analysen bereitzustellen.
Die drei Kernschritte: Extract bezieht Daten aus Quellsystemen, oft mit Konnektoren oder Schnittstellen. Transform umfasst Reinigung,
Der Ablauf wird in der Regel durch eine Orchestrierungslogik gesteuert, die zeitgesteuerte oder ereignisbasierte Jobs ausführt.
In der Praxis unterscheiden sich ETLProzesse oft von ELT: Beim ETL erfolgen Transformationen vor dem Laden,
Wichtige Aspekte sind Datenqualität, Validierung, Fehlerbehandlung, Logging, Monitoring, Sicherheits- und Compliance-Anforderungen sowie Metadaten und Datenherkunft ( lineage).