onderzoeksdataset
Een onderzoeksdataset is een verzameling gegevens die is verzameld of samengesteld voor wetenschappelijk onderzoek. Datasets dienen als basis voor analyse, evaluatie en reproduceerbaarheid en bevatten vaak naast de ruwe waarnemingen ook metadata over de verzameling, context en methoden.
Een dataset bestaat uit records en variabelen, met een data dictionary of metadata die de betekenis van
Datasets variëren in type en formaat, zoals numerieke tijdreeksen, tekstcorpora, beeld- en geluidsbestanden, of gecombineerde data.
Privacy en ethiek spelen een grote rol bij onderzoeksdatasets met persoonsgebonden data. Vaak worden privacybescherming en
Kwaliteit, betrouwbaarheid en reproduceerbaarheid worden bevorderd door duidelijke documentatie, data-kwaliteitcontroles, versiebeheer en het publiceren van data-annotaties
Standaarden en interoperabiliteit maken het mogelijk data te combineren. Voor metadata bestaan standaarden zoals Dublin Core
Onderzoeksdataset wordt gebruikt in academisch onderzoek, onderwijs en beleid. Voorbeelden zijn open dataportalen, onderzoeksinstituten en publieke