Home

Dataverzamelingen

Dataverzameling is een verzameling gegevens die samen een coherent geheel vormen voor analyse, hergebruik of publicatie. In de praktijk wordt vaak gesproken van een dataset, opgeslagen in tabellen, databases of bestanden. Dataverzamelingen variëren van kleine lijsten tot grote bestanden met waarnemingen of metagegevens.

Een dataverzameling bevat data en metadata die herkomst, tijdstip, context en kwaliteit beschrijven. Belangrijke elementen zijn

Types en opslag: gestructureerde data (tabellen), semigestructureerde data (JSON, XML) en ongestructureerde data (tekst, beeld). Opslag

Governance en rechten: eigenaarschap, data stewardship en privacy zijn essentieel, zeker onder wet- en regelgeving zoals

Toegang en interoperabiliteit: vele dataverzamelingen worden gedeeld via portals of API's. Gemeenschappelijke normen en formaten vergroten

Levenscyclus en duurzaam beheer: creatie, schoonmaak, normalisatie, integratie en curatie leiden tot betrouwbare data. Langdurige opslag

Toepassingen variëren van wetenschappelijk onderzoek en overheidsopen data tot bedrijfsanalyse en beleidsondersteuning. Voorbeelden zijn wetenschappelijke datasets,

---

variabelen,
records,
formaten
en
kwaliteitsindicatoren.
Metadata
vergemakkelijkt
vindbaarheid,
interpretatie
en
reproduceerbaarheid
van
analyses.
vindt
plaats
in
databases,
spreadsheets,
data
lakes
of
datawarehouses.
Datasets
kunnen
statisch
zijn
of
regelmatig
worden
bijgewerkt.
de
AVG.
Licenties
bepalen
het
gebruik
en
de
herverwerking.
Open
data
bevordert
herbruikbaarheid;
restricties
kunnen
van
toepassing
zijn.
interoperabiliteit
en
reuse.
Goede
documentatie
en
duidelijke
licenties
zijn
cruciaal.
vereist
preservatieplanning
en
periodieke
kwaliteitscontroles.
open
data-portals
en
genoom-
of
klimaatdatabanken.