ristikkäisvalidaation
Ristikkäisvalidaatio, tunnetaan myös nimellä ristiinvalidaatio tai K-kertaisen ristikkäisvalidaationa, on koneoppimisessa käytetty menetelmä, jolla arvioidaan mallin ennustuskykyä ja yleistettävyyttä uuteen, näkemättömään dataan. Se auttaa havaitsemaan ylisovituksen (overfitting), jossa malli oppii harjoitusdatan liian hyvin, mukaan lukien kohinan, ja suoriutuu siksi huonosti uudella datalla.
Menetelmä toimii jakamalla alkuperäinen data useampaan osaan, joita kutsutaan "poimuiksi" tai "kerroksiksi". Tyypillisesti käytetään K-kertaista ristikkäisvalidaatiota,
Kun kaikki K harjoituskertaa on suoritettu, saadaan K erilaista mallia ja K erilaista suorituskykyarviointia. Näiden arviointien