testmängd
Testmängd, eller testset, är den del av ett dataset som används för att utvärdera en modells generalisering till ny data. Den avskiljs från träningsmängden och, i de flesta sammanhang, från valideringsmängden. Syftet är att ge en opåverkad uppskattning av hur modellen kommer prestera i verkliga tillämpningar.
Vid konstruktion av modeller delas data ofta upp i träning, validering och test. Testmängden används först
Metoder för uppdelning inkluderar slumpmässig fördelning, stratifierad uppdelning som bevarar klassernas proportioner, samt tidsbaserad uppdelning vid
För att säkerställa resultatens tillförlitlighet bör data leakage undvikas och förbehandling ske genom en reproducerbar pipeline