Valideringsförlusten - Infinite Lexicon - Infinite Lexicon

Valideringsförlusten

Valideringsförlusten, ofta kallad valideringsförlust, är ett mått på hur väl en maskininlärningsmodell presterar på en separat valideringsuppsättning som inte användes vid träningsfasen. Förlusten beräknas som medelvärdet av förlustfunktionen över alla exempel i valideringsuppsättningen. Den används som en proxy för modellens generalisering till nya data.

Vid träningen beräknas vanligtvis både träningsförlust och valideringsförlust. Förlustfunktionen kan vara korsentropi vid klassificering eller medelkvadratfel

En vanlig användning är tidig stopp: träningen avbryts när valideringsförlusten inte längre förbättras, trots fortsatt förbättring

Det är viktigt att valideringsförlusten speglar en representativ datafördelning och att det inte uppstår data leakage

För att minska valideringsförlusten används strategier som ökad mängd data, dataaugmentation, regularisering (L1/L2, dropout), enklare modell,

Valideringsförlusten

hyperparametrar.

träningsförlusten.

valideringsförlusten

träningsförlusten

överanpassning

distributionsskifte

valideringsuppsättningen.

Valideringsförlusten

valideringsnoggrannhet

i

hyperparameteroptimering.

representativitet