Home

imputatiemethoden

Imputatiemethoden zijn statistische technieken die ontbrekende waarden in datasets vervangen door schattingen. Doel is om verlies aan informatiedichtheid te beperken en bias te verminderen, zodat analyses kunnen worden uitgevoerd op complete datasets of op datasets met minder ontbrekende waarden.

Er bestaan twee hoofdbenaderingen: enkelvoudige imputatie, waarbij één waarde wordt toegewezen, en meervoudige imputatie, waarbij meerdere

Bij enkelvoudige imputatie behoort middel- of mediaanvervanging, regressie-imputatie en k-nearest neighbors imputatie. Hot deck imputatie vangt

Meervoudige imputatie omvat methoden zoals MICE en het EM-algoritme, die datasets meerdere keren imputeert en Rubin’s

Het kiezen van een imputatiemethode hangt af van de aard van de ontbrekende data en het verwachte

Diagnostische stappen omvatten vergelijking van de verdelingen van geobserveerde en geïmputeerde waarden, controle op convergentie en

In praktijk verbeteren imputatiemethoden de geldigheid van statistische conclusies, mits correct toegepast en transparant gerapporteerd.

plausibele
waarden
worden
gegenereerd
en
de
onzekerheid
wordt
meegenomen.
ontbrekende
waarden
op
basis
van
waarden
uit
vergelijkbare
waarnemingen.
regels
gebruikt
om
de
resultaten
samen
te
voegen.
missingness-mechanisme:
MCAR,
MAR
of
MNAR.
Meervoudige
imputatie
is
doorgaans
robuuster
bij
MAR
en
erkent
onzekerheid
beter
dan
enkelvoudige
imputatie.
het
toetsen
van
de
gevoeligheid
van
conclusies.
Imputatie
kan
bias
introduceren
als
het
model
ontoereikend
is.