Ristikkäisvalidaatiota
Ristikkäisvalidaatio, tunnetaan myös nimellä ristiinvalidaatio, on tilastollinen menetelmä, jota käytetään koneoppimismallien suorituskyvyn arviointiin ja varmistamiseen, että malli yleistyy hyvin uusille, ennen näkemättömille tiedoille. Sen sijaan, että data jaettaisiin vain yhteen koulutus- ja testijoukkoon, ristikkäisvalidaatio jakaa datan useisiin osiin tai "taitteisiin".
Yleisin ristikkäisvalidaation muoto on k-taitteinen ristikkäisvalidaatio (k-fold cross-validation). Tässä menetelmässä alkuperäinen datasetti jaetaan satunnaisesti k yhtä
Ristikkäisvalidaatiota käytetään yleisesti mallin valinnassa ja hyperparametrien optimoinnissa. Se auttaa tunnistamaan ylisovituksen (overfitting) ja alisovituksen (underfitting)