Testmengen
Testmengen, auch Testsets genannt, sind Teilmengen eines Datensatzes, die reserviert werden, um die Leistung eines Modells nach dem Training zu bewerten. Sie sollen unbekannte Daten widerspiegeln und bleiben getrennt von den für das Training verwendeten Daten (und oft auch von den Validierungsdaten).
Aufbau und Vorgehen: Um eine unverzerrte Schätzung zu erhalten, sollte die Testmenge repräsentativ für die Population
Auswertung: Die Leistung des Modells auf der Testmenge wird mit geeigneten Metriken bewertet, abhängig von der
Fehlerquellen: Datenleckagen, bei denen Informationen aus der Testmenge das Training beeinflussen, oder Vorverarbeitungen, die auf dem
Zusammenhang: In der Kreuzvalidierung erfüllt sich der Aufgabenbereich der Testmenge durch das jeweils hold-out-Fold; bei Zeitreihen