malliarvio
Malliarvio on prosessi, jossa rakennettujen ennustemallien suorituskyky arvioidaan erillisellä datalla tai ennalta määritellyllä testausprotokollalla. Se kuuluu data-analyysiin, koneoppimiseen ja tilastolliseen mallintamiseen, ja sen tarkoituksena on mitata mallin tarkkuus, yleistettävyys sekä soveltuvuus käytäntöön. Malliarviointi kattaa sekä regressio- että luokittelutehtävät sekä todennäköisyyspohjaiset ennusteet.
Yleisimmät menetelmät ovat hold-out- testaus, jossa data jaetaan koulutus- ja testijoukkoihin, sekä ristiinvalidointi (k-fold, stratified k-fold),
Merkittävät mittarit riippuvat tehtävätyypistä. Regression tapauksessa yleisiä ovat RMSE, MAE, MSE ja R-neliö. Luokittelussa käytetään tarkkuutta
Prosessi sisältää datan esikäsittelyn, koulutuksen, hyperparametrien hienosäädön, mallin valinnan ja lopullisen testauksen riippumattomalla testijoukolla. Tärkeitä huomioita