Ristivalidoinnissa
Ristivalidoinnissa (cross-validation) on tilastollinen menetelmä, jolla arvioidaan mallin yleistymiskyky ja suorituskyky käyttämällä olemassa olevaa dataa ilman erillistä suurempaa testidataa. Tavoitteena on antaa luotettava arvio siitä, miten malli suoriutuisi uusilla, näkemättömillä havainnoilla. Menetelmää käytetään erityisesti mallin valinnan ja hyperparametrien säätämisen yhteydessä sekä yleisen virheen estimoinnissa.
Yleisimmät variantit ovat k-fold ristivalidointi ja Leave-One-Out-ristivalidointi (LOOCV). K-foldissa data jaetaan k yhtä suureen osaan. Jokaisessa
Nested cross-validation sisältää sisäisen ristivalidoinnin hyperparametrien optimointiin ja ulkoisen arvioinnin suorituskyvyn estimoimiseksi, mikä vähentää yliopetusharjan mahdollisuutta.
Suorituskykymittareita voivat olla tarkkuus, precisiolle recall, F1-pisteet sekä ROC-AUC. Ristivalidointia käytetään sekä pienissä että keskisuurissa datoissa