DatenTransformation
DatenTransformation bezeichnet den Prozess der Umwandlung von Daten von einer Repräsentation, Struktur oder Qualität in eine andere, um sie für Speicherung, Integration, Analyse oder Weiterverarbeitung nutzbar zu machen. Sie ist ein zentraler Bestandteil von Datenintegrations- und Datenverarbeitungsprozessen und kommt in verschiedenen Kontexten vor, zum Beispiel beim Zusammenführen von Daten aus unterschiedlichen Systemen, beim Umwandeln von Formaten oder beim Anpassen von Datentypen und Einheiten. Typischerweise wird sie im Rahmen von ETL- oder ELT-Pipelines eingesetzt.
Zu den grundlegenden Arten gehören schemabasierte Transformationen, Datentypkonversionen, Normalisierung und Denormalisierung, Aggregationen, Filterung, Pivot- und Flatten-Operationen
Technisch erfolgt die Transformation oft über Transformationsregeln oder Funktionen, die in SQL, Programmiersprachen wie Python oder
Wichtige Aspekte der Praxis umfassen Datenqualität, Governance, Herkunftsnachweise (Data Lineage) und Skalierbarkeit der Transformation bei großen