Valideringsförlusten
Valideringsförlusten, ofta kallad valideringsförlust, är ett mått på hur väl en maskininlärningsmodell presterar på en separat valideringsuppsättning som inte användes vid träningsfasen. Förlusten beräknas som medelvärdet av förlustfunktionen över alla exempel i valideringsuppsättningen. Den används som en proxy för modellens generalisering till nya data.
Vid träningen beräknas vanligtvis både träningsförlust och valideringsförlust. Förlustfunktionen kan vara korsentropi vid klassificering eller medelkvadratfel
En vanlig användning är tidig stopp: träningen avbryts när valideringsförlusten inte längre förbättras, trots fortsatt förbättring
Det är viktigt att valideringsförlusten speglar en representativ datafördelning och att det inte uppstår data leakage
För att minska valideringsförlusten används strategier som ökad mängd data, dataaugmentation, regularisering (L1/L2, dropout), enklare modell,