Vorverarbeitung
Vorverarbeitung (englisch preprocessing) bezeichnet in der Informatik und Datenanalyse den Prozess, Rohdaten in eine Form zu bringen, die von Analyseverfahren, Modellen oder Algorithmen effizient genutzt werden kann. Ziel ist es, die Qualität der Daten zu verbessern, Redundanzen zu verringern, Inkonsistenzen zu beseitigen und die Rechenleistung zu optimieren. Durch Vorverarbeitung lassen sich Verzerrungen reduzieren und die Vergleichbarkeit von Datensätzen erhöhen; sie dient zugleich der Reduktion von Rauschen und der Anpassung unterschiedlicher Formate an eine einheitliche Eingabe.
Typische Schritte umfassen Datenbereinigung, fehlende Werte zu behandeln, Ausreißer zu handhaben, Normalisierung oder Standardisierung, Skalierung, Kodierung
Anwendungsfelder reichen von maschinellem Lernen über Bild- und Sprachverarbeitung bis zu Textanalyse. In der Bildverarbeitung gehören
Die Praxis erfordert Reproduzierbarkeit und Dokumentation, da Vorverarbeitungsergebnisse die Modellleistung stark beeinflussen können. Oft wird Vorverarbeitung