Imputaatiomenetelmiä
Imputaatiomenetelmiä ovat tilastollisia tai koneoppimisen menetelmiä, joita käytetään puuttuvien arvojen korvaamiseen datajoukossa. Puuttuvat arvot voivat syntyä monista syistä, kuten mittausvirheistä, tiedonkeruuongelmista tai järjestelmävirheistä. Niiden läsnäolo voi vääristää analyysin tuloksia ja heikentää tilastollisten mallien ennustekykyä. Imputointi pyrkii minimoimaan näitä ongelmia täyttämällä puuttuvat kohdat uskottavilla arvoilla.
Yksinkertaisimpia imputaatiomenetelmiä ovat keskiarvo-, mediaani- tai moodi-imputointi, joissa puuttuva arvo korvataan ryhmän tai muuttujan vastaavalla tunnusluvulla.
Monimutkaisempia menetelmiä ovat esimerkiksi regressioimputointi, jossa puuttuva arvo ennustetaan muiden muuttujien perusteella regressiomallilla. Myös koneoppimiseen perustuvat
Monivaiheinen imputointi (multiple imputation) on edistyneempi tekniikka, jossa puuttuvat arvot korvataan useilla uskottavilla arvoilla, ja analyysi
---