Vorverarbeitungsschritte
Vorverarbeitungsschritte, auch Preprocessing genannt, umfassen alle Maßnahmen, die darauf abzielen, Rohdaten für Analyse- oder Lernprozesse vorzubereiten. Ziel ist es, die Qualität der Daten zu erhöhen, Verzerrungen zu reduzieren und die Leistungsfähigkeit von Modellen zu verbessern, ohne die zugrunde liegenden Informationen zu verfälschen.
Zu den typischen Aufgaben gehören Datenbereinigung (Entfernen von Duplikaten, Fehlern, Inkonsistenzen), der Umgang mit fehlenden Werten
In Text- oder Bilddaten können spezifische Vorverarbeitungsschritte erforderlich sein, wie Tokenisierung, Stemming oder Stopwort-Entfernung bei Texten,