Dataverzamelingen
Dataverzameling is een verzameling gegevens die samen een coherent geheel vormen voor analyse, hergebruik of publicatie. In de praktijk wordt vaak gesproken van een dataset, opgeslagen in tabellen, databases of bestanden. Dataverzamelingen variëren van kleine lijsten tot grote bestanden met waarnemingen of metagegevens.
Een dataverzameling bevat data en metadata die herkomst, tijdstip, context en kwaliteit beschrijven. Belangrijke elementen zijn
Types en opslag: gestructureerde data (tabellen), semigestructureerde data (JSON, XML) en ongestructureerde data (tekst, beeld). Opslag
Governance en rechten: eigenaarschap, data stewardship en privacy zijn essentieel, zeker onder wet- en regelgeving zoals
Toegang en interoperabiliteit: vele dataverzamelingen worden gedeeld via portals of API's. Gemeenschappelijke normen en formaten vergroten
Levenscyclus en duurzaam beheer: creatie, schoonmaak, normalisatie, integratie en curatie leiden tot betrouwbare data. Langdurige opslag
Toepassingen variëren van wetenschappelijk onderzoek en overheidsopen data tot bedrijfsanalyse en beleidsondersteuning. Voorbeelden zijn wetenschappelijke datasets,
---