ristiinvalidaatiossa
Ristiinvalidaatio on tilastollinen uudelleenarvioinnin menetelmä, jolla arvioidaan mallin yleistymiskykyä uusiin havaintoihin. Aineisto jaetaan useisiin osiin (fold). Malli koulutetaan useimmiten kaikilla jakson osista lukuun ottamatta yhtä osiota, ja testataan sen suoritus kyseisellä testiosuudella. Tämä toistetaan, kunnes jokainen osio on toiminut testijoukkona. Lopullinen arviointi muodostetaan useiden testauksien tulosten keskiarvosta.
Yleisimmät variantit ovat k-fold ristivalidaatio, leave-one-out (LOO) -ristivalidaatio sekä stratified k-fold, jossa kullekin foldille pyritään säilyttämään
CV:tä käytetään mallin suorituskyvyn arviointiin, mallien vertailuun sekä hyperparametrien virittämiseen. Nested cross-validation mahdollistaa sekä parametrihausta että
Ristiinvalidaatio tuottaa arvion yleiskäyttöiselle virheelle, kuten tarkkuudelle, RMSE:lle tai AUC-arvolle, riippuen käytettävästä mittarista. Se on keskeinen