Datenvorverarbeitung
Datenvorverarbeitung bezeichnet den Teilprozess der Datenanalyse, der Rohdaten in eine Form überführt, die für statistische Analysen oder maschinelles Lernen geeignet ist. Sie dient der Verbesserung der Datenqualität, der Reduktion von Verzerrungen und der Erhöhung der Effizienz der Modellierung.
Zu den typischen Aufgaben gehören die Bereinigung fehlerhafter oder fehlender Werte, die Beseitigung redundanter oder inkonsistenter
Eine wichtige Entscheidung betrifft die Behandlung fehlender Werte, Ausreißer und die Verhinderung von Datenleckagen bei der
Die Ergebnisse der Datenvorverarbeitung bilden die Basis für darauf folgende Analysen oder Lernmodelle. Durch systematische Vorverarbeitung