Testmängder
Testmängder är en delmängd av en dataset som används för att utvärdera prestandan hos en tränad modell. De är åtskilda från träningsmängden och, i många arbetsflöden, från valideringsmängden. Syftet med testmängden är att ge en oberoende uppskattning av hur modellen sannolikt kommer att prestera på ny, osedd data, dvs. dess generalisering.
Vanligtvis delas data upp i träning, validering och test. Träningen används för att lära modellen, valideringen
Vid konstruktion av testmängden bör man undvika dataläckage. Transformationer och modellrelaterade inställningar som lärs in från
Vanlig storlek är ofta 20–30 procent av det ursprungliga datasetet, men valet beror på datasetets storlek och