Home

dataverzamelings

Dataverzamelings is een term die verwijst naar het proces van het verzamelen en vastleggen van gegevens uit diverse bronnen ten behoeve van analyse, evaluatie of beleid. Het begrip kan zowel slaan op de gehele verzamelde dataset als op de activiteiten die leiden tot die datasets, zoals planning, uitvoering en kwaliteitscontrole.

Dataverzamelings wordt in veel sectoren toegepast, waaronder statistiek, wetenschappelijk onderzoek, bedrijfsanalyse en openbaar bestuur. De data

Een (dataverzamelings)cyclus omvat doorgaans doeldefinitie en ontwerp van de methode, selectie van steekproeven of meetapparatuur, uitvoering

Privacy en ethiek spelen een centrale rol. Wet- en regelgeving zoals de AVG/GDPR regelen hoe persoonsgegevens

Uitdagingen bij dataverzamelings zijn onder meer bias en representativiteit, inconsistentie tussen bronnen, ontbrekende waarden, beveiligingsrisico’s en

---

kunnen
afkomstig
zijn
van
primaire
bronnen
(bijvoorbeeld
enquêtes,
experimenten,
sensoren)
of
uit
secundaire
bronnen
(registraties,
logbestanden,
publicaties).
Ze
kunnen
gestructureerd
zijn
(tabellen),
ongestructureerd
(teksten,
afbeeldingen)
of
semi-gestructureerd
(JSON,
XML).
van
de
verzameling
en
kwaliteitszorg
zoals
validatie,
deduplicatie
en
metadata-registratie.
Goede
documentatie
vergroot
reproduceerbaarheid
en
herbruikbaarheid
van
de
gegevens.
verzameld
en
verwerkt
worden,
en
anonimisering
of
pseudonimisering
is
vaak
vereist.
Data
governance
zorgt
voor
duidelijk
eigenaarschap,
toegangsrechten
en
bewaartermijnen,
en
waarborgt
beveiliging
en
integriteit.
de
kosten
van
opslag
en
onderhoud.
Praktijken
worden
gestandaardiseerd
om
data-inzet
en
open
data
mogelijk
te
maken,
met
aandacht
voor
kwaliteit
en
verantwoord
gebruik.