datadekning
Datadekning innebär hur mycket av ett dataset som faktiskt innehåller information för de relevanta enheterna och variablerna. Det beskriver i vilken utsträckning data är närvarande, snarare än endast antalet observationsenheter.
Datadekning kan delas in i flera dimensioner: observationsdäckning (andel enheter som har någon observerad data), variabel
Vanliga mått är andelen icke-missade värden, medelvärden för täckning per variabel och per enhet samt tidsmässig
Låg datadekning kan ge bias och minska statistisk power, medan hög täckning underlättar robusta slutsatser. Förbättringar
Användningsområden inkluderar hälso- och sjukvård, befolkningsforskning, miljö och företagsdata där källor varierar i fullständighet. Att dokumentera