mallivalintaa
Mallivalinta on tilastotieteessä ja koneoppimisessa käytetty prosessi, jossa valitaan joukosta ehdokkaita parhaiten dataan soveltuva malli. Tavoitteena voi olla ennustetarkkuus, tulkittavuus tai molempien tasapainon saavuttaminen. Mallin valinta kohtaa usein kompromissin mallin monimutkaisuuden ja sen soveltuvuuden välillä: liian yksinkertainen malli voi alikäyttää dataa, kun taas liian monimutkainen malli voi ylikouluttaa ja heikentää yleistyvyyttä.
Yleisimmät valintamenetelmät jakautuvat seuraaviin ryhmiin. Likelihood- tai nested-mallien testauksessa vertaillaan malleja, joiden mittausmalli on samaan datakokonaisuuteen
Käytännön valintaan vaikuttavat tavoite (ennustaminen vs. tulkinta), datan määrä ja laatu sekä laskennalliset resurssit. Mallivalinta ei