imputaatiot
Imputaatiot, tai imputaatio, ovat tilastollisia menetelmiä puuttuvien arvojen korvaamiseksi datamassassa ennen analyysia. Tavoitteena on säilyttää näytteiden koko, estää systemaattinen harha ja parantaa estimointien tarkkuutta. Puuttuvien arvojen syntymekanismia ei aina tiedetä, mutta yleisimmin puuttuvuus voidaan ajatella MCAR-, MAR- tai MNAR-mekanismin alaisuuteen; imputaatio-oletukset voivat tässä vaikuttaa tuloksiin.
Yleisimmät lähestymistavat voidaan jakaa yksinkertaisiin ja kehittyneempiin menetelmiin. Yksinkertaiset täytöt korvaavat puuttuvan arvon yhdellä tilastollisella luvulla,
Monimutkaisemmassa viitekehyksessä käytetään monikimputaatioa (multiple imputation, MI), jossa luodaan useita epävarmuutta kuvaavia täydennysdatasettejä. Jokaisessa datasetissä arvoja
Imputaatiot ovat yleisiä lääketieteessä, taloudessa ja yhteiskuntatieteissä, missä puuttuvat tiedot voivat olla yleisiä. Riskit liittyvät siihen,
Suositut työkalut: R:n packages kuten mice, missForest ja Amelia sekä Pythonin kirjastot kuten scikit-learnin IterativeImputer tai