Kryssvalidering - Infinite Lexicon - Infinite Lexicon

Kryssvalidering

Kryssvalidering, eller cross-validation, är en återupprepande valideringsmetod inom statistik och maskininlärning som används för att uppskatta hur bra en modell förväntas prestera på ny data. Metoden delar ofta data i flera avsnitt och upprepar modellbygge och utvärdering över olika uppsättningar. Syftet är att motverka överanpassning, ge en mer tillförlitlig bedömning av generaliserbarheten och reducera beroendet av en enda train-test-splits.

Vanliga former är k-falds kryssvalidering där data delas i k lika stora folds och modellen tränas på

Processen innebär att dela data i folds, träna på k−1 och utvärdera på den återstående, upprepa tills

Begränsningar inkluderar risk för dataläckage om funktioner skapas på hela datasetet före uppdelningen, hög beräkningskostnad för

klassfördelningen

i

klassificering.

hyperparametertuning

modelljämförelse.

Kryssvalidering

modelljämförelse

hyperparameter-tuning,

i

parametertuning

utvärderingen.

I

implementationer

i

StratifiedKFold,

cross_val_score,

cross_validate)

i