Vorverarbeitungsergebnisse
Vorverarbeitungsergebnisse bezeichnet die Gesamtheit der Outputs, die aus der Vorverarbeitung roher Daten hervorgehen. Sie bilden die Grundlage für nachfolgende Analysen oder Modellierung und umfassen sowohl bereinigte Datensätze als auch die durchgeführten Transformationen.
Typische Schritte der Vorverarbeitung führen zu unterschiedlichen Ergebnissen. Datenbereinigung umfasst das Entfernen redundanter oder fehlerhafter Einträge,
Wichtigkeit und Nutzung: Die Ergebnisse der Vorverarbeitung beeinflussen die Leistung von Modellen maßgeblich. Eine klare Dokumentation
Beispiele: Ein bereinigter Datensatz mit imputierten fehlenden Werten, kategoriale Variablen kodiert (One-Hot-Kodierung) und Merkmale skaliert; eine