ristiivalidointia
Ristiinvalidaatio on menetelmä koneoppimismallien suorituskyvyn arvioimiseksi ja mallien valitsemiseksi. Se auttaa ennustamaan, kuinka hyvin malli yleistää uuteen, näkemättömään dataan. Yksinkertaisimmillaan, k-kertainen ristiinvalidaatio jakaa datan k yhtä suureen osaan eli "taitteeseen". Malli koulutetaan sitten k kertaa, jokaisella kerralla käyttäen yhtä taittetta mallin testaamiseen ja jäljelle jääviä k-1 taitteita kouluttamiseen. Lopullinen suorituskyky on näiden k testin tulosten keskiarvo.
Tämän menetelmän etuna on, että se hyödyntää kaiken datan sekä koulutukseen että testaukseen, vähentäen satunnaisuuden vaikutusta,
Yleisimmät ristiinvalidoinnin muodot ovat k-kertainen ristiinvalidaatio, leave-one-out ristiinvalidaatio (erikoistapaus, jossa k on yhtä suuri kuin datan