datarensningssteg
Datarensningssteg är en samling processer som syftar till att förbättra kvaliteten på data inför analys och beslutsfattande. Genom systematiska åtgärder mot fel, inkonsekvenser och saknade värden underlättas tillförlitliga resultat och bättre jämförbarhet över källor och tidsperioder.
Vanliga steg i datarensning inkluderar dataprofilering för att få en översikt över datakvalitet och struktur, hantering
Tekniker och verktyg som används omfattar SQL-frågor, ETL- eller ELT-verktyg, och skript i Python eller R. Vanliga
Resultatet av datarensningssteg är en större konsekvens och fullständighet, ökad konsistens och korrekthet samt bättre spårbarhet