validointijoukkoa
Validointijoukko on koneoppimisessa käytettävä datajoukko, joka erotetaan koulutusjoukosta (treenaukseen käytetty data) sekä testijoukosta (lopulliseen arviointiin tarkoitettu data). Sen tehtävänä on antaa riippumaton arvio mallin suorituskyvystä sekä mahdollistaa hyperparametrien säätö ja malli- tai konfiguraation valinta ennen lopullista testausta.
Validointijoukon tarkoitus on tukea mallin yleistyvyyden arviointia. Kun malli opetetaan eri parametriseteillä ja arvoidaan niiden suorituskykyä
Käyttötavat vaihtelevat. Yleinen lähestymistapa on hold-out -jako, jossa osa datasta varataan validointikäyttöön. Toisinaan käytetään K-kertaista ristiinvalidointia
Rakenteellisesti validointijoukko tulisi olla edustava sekä sen koko vastuullinen: sen tulisi säilyttää luokkien jakauma, eikä sitä
Validointijoukko eroaa testijoukosta: testijoukko arvioi lopullisen yleiskäytännön suorituskyvyn, kun malli on vakioitu valinnan jälkeen. Ylläpidossa validointijoukko