PreprocessingSchritte
PreprocessingSchritte bezeichnet die Gesamtheit von vorbereitenden Operationen, die an Rohdaten vorgenommen werden, bevor sie analysiert oder für Modelle verwendet werden. Sie bildet den ersten Schritt vieler datengetriebener Prozesse und dient der Qualität, Konsistenz und Nutzbarkeit der Daten.
Zu den typischen Bereichen gehören Datenbereinigung, Transformation, Merkmalsengineering, Kodierung, Datenreduktion und Datenteilung. Die Datenbereinigung umfasst das
In der Textverarbeitung umfassen Preprocessing-Schritte Tokenisierung, Stopwort-Entfernung, Stemming oder Lemmatisierung sowie Vektorisierung. In der Bildverarbeitung gehören
Der Arbeitsfluss zielt auf Reproduzierbarkeit: Ziel definieren, Rohdaten prüfen, geeignete Schritte auswählen, transformieren, Auswirkungen prüfen und