datasammanställningar
Datasammanställningar är systematiska samlingar av data som hämtats från olika källor och sammanförts till en enhetlig struktur för analys, jämförelser och beslutsstöd. De kan omfatta strukturerad data i tabeller, ostrukturerad information som text eller bilder, samt relaterad metadata som beskriver källor, tidsperioder och variation.
Processen omfattar insamling, urval, rensning, standardisering, harmonisering och validering av data, följt av dokumentation av metadata
Källor kan vara offentliga register, företags- och verksamhetssystem, enkäter, sensordata, forskningsexperiment och publika databaser. Källor kan
Typer inkluderar strukturerade dataset (rader och kolonner), ostrukturerade dataset (text, bild, video), så kallade meta- eller
Användningarna är breda och omfattar stöd för forskning, myndighetsbeslut, näringslivsanalys, samhällsplanering och öppna dataportaler. Kvalitet och
Hantering och styrning av datasammanställningar sker ofta genom data governance, metadata, data lineage, dokumentation och versionering,
Exempel finns i offentliga open data-projekt och portar som data.se, där nationella och kommunala datasammanställningar görs