Kryssvalidering
Kryssvalidering, eller cross-validation, är en återupprepande valideringsmetod inom statistik och maskininlärning som används för att uppskatta hur bra en modell förväntas prestera på ny data. Metoden delar ofta data i flera avsnitt och upprepar modellbygge och utvärdering över olika uppsättningar. Syftet är att motverka överanpassning, ge en mer tillförlitlig bedömning av generaliserbarheten och reducera beroendet av en enda train-test-splits.
Vanliga former är k-falds kryssvalidering där data delas i k lika stora folds och modellen tränas på
Processen innebär att dela data i folds, träna på k−1 och utvärdera på den återstående, upprepa tills
Begränsningar inkluderar risk för dataläckage om funktioner skapas på hela datasetet före uppdelningen, hög beräkningskostnad för