korsvalidering
Korsvalidering, også omtalt som kryssvalidering, er en statistisk metode for å vurdere hvor godt en modell forventes å prestere på ny, ukjent data. Metoden deler dataene i flere undergrupper og bruker deler til trening og testing slik at man får et mer pålitelig estimat av modellens generaliseringsevne enn ved en enkel trenings- og testsplit.
Den vanligste formen er k-fold korsvalidering, hvor datasettet deles inn i k like store fold. Hver fold
Prosedyren innebærer at dataene tilfeldig fordeles i fold, modellen trenes på k−1 fold og evalueres på den
Fordeler ved korsvalidering inkluderer et mer robust estimat av modellens ytelse og reduksjon av avhengigheten mellom
Korsvalidering brukes bredt i maskinlæring, statistikk og dataanalyse for modellvalg, hyperparameterinnstilling og vurdering av generaliseringsevne.