krydsvalidering
Krydsvalidering er en metode inden for maskinlæring og statistik til at vurdere en models generalisering ved at opdele et dataset i flere delmængder og gentagne gange træne og evaluere modellen på forskellige kombinationer af trænings- og testdata. Ideen er at få en mere stabil og mindre biased estimering af modelens præstation end ved en enkelt trænings-/testopdeling.
Den typiske fremgangsmåde er k-fold krydsvalidering. Datasættet opdeles i k lige store fold, og for hver af
Fordele ved krydsvalidering inkluderer udnyttelse af hele datasættet til både træning og evaluering samt mindre risiko
Krydsvalidering bruges bredt til at sammenligne modeller, vælge hyperparametre og få mere pålidelige estimater af en