imputoinnissa
Imputointi on tilastollinen menetelmä puuttuvien tietojen käsittelyyn. Imputoinnissa puuttuvat arvot korvataan todennäköisiin tai mallinnettuihin arvoihin siten, että aineiston analysoinnista voidaan hyödyntää koko otos. Puuttuvien arvojen mekanismeja kuvataan yleisesti MCARilla (poissa olevat arvot eivät liity mihinkään havaittuihin arvoihin), MARilla (puuttuvuus riippuu havainnoiduista arvoista) ja MNARilla (puuttuvuus riippuu todellisista, mutta ei havaituista arvoista).
Menetelmät jaotellaan yksittäiseen imputointiin ja moninkertaiseen imputointiin. Yksittäinen imputointi voi olla esimerkiksi keskiarvo- tai mediaanimputointi, regressionimputointi
Imputointiprosessi sisältää määrittely- ja mallintamiskierroksia: valitaan sopivat imputointimalleja, tuotetaan useita täydennettyjä datasetteja, suoritetaan analyysit ja yhdistetään
Edut ja rajoitteet. Imputointi voi parantaa estimointitehoa ja vähentää harhaa sekä mahdollistaa monimutkaisten mallien käytön. Se
Käyttökohteita ovat muun muassa terveystieteet, sosiaali- ja käyttäytymistieteet sekä taloustiede. Hyvä käytäntö edellyttää läpinäkyvää raportointia, herkkyysanalyysiä