datasömmar
Datasömmar är diskontinuiteter som uppstår när data från olika källor, tidsperioder eller mätmetoder sammanställs i en gemensam datamängd. Fenomenet kan skapa artificiella mönster eller dölja verkliga trender och betraktas som en central utmaning vid datafusion och integrering av register eller longitudinella studier.
Orsakerna inkluderar olika definitioner och variabler, olika mätinstrument och enheter, varierande tids- eller geografisk täckning, olika
Exempel förekommer inom hälso- och sjukvårdsregistrets sammanställd statistik där kodsystem ändras över tid, i miljödata som
Detektion och bedömning av datasömmar innefattar jämförande analys mellan källor, visualisering av tidsserier runt övergångsperioder, förändringspunktsanalys
Se även: data integration, datakvalitet, datastyrning, harmonisering.