ristvalideerimise
Ristvalideerimine on statistikas ja masinõppes kasutatav resampling-metoodika, mille abil hinnatakse mudeli üldistuvust sõltumatule andmekogumile. Selle eesmärk on pakkuda paremini objektiivset hinnangut mudeli toimivusest ning vähendada üleõppimise ohtu.
Kõige levinum vorm on k-fold ristvalideerimine: andmed jagatakse võrdseteks osadeks ehk foldideks. Mudel treenitakse foldide hulgas
Töövoog hõlmab andmete jagamist, mudeli treenimist iga foldil, tulemuste hindamist sobiva veamõõdikuga (nt täpsus, RMSE, AUC)
Ristvalideerimise peamised kasutusalad on mudeli üldistuvuse hindamine, erinevate algoritmide võrdlemine ja hüperparameetrite optimeerimine. See meetod aitab