datasetominaisuuden
Datasetominaisuus (datasetin ominaisuus) on käsite, jolla viitataan datasetin kuvaaviin piirteisiin ja ominaisuuksiin. Se kattaa sekä tekniset tiedot että hallinnolliset tiedot, jotka määrittelevät, mitä data sisältää, miten se on rakennettu, sekä miten sitä voidaan hakea, käyttää ja arvioida.
Tyypillisiä datasetin ominaisuuksia ovat rakenne ja muoto (structured, semi-structured, unstructured), datatyyppien jakautuminen (numerical, categorical, text), rivien
Hallinnolliset ominaisuudet kattavat tallennusmuodon, tallennuspaikan sekä käyttöoikeudet, turvallisuuden ja eettiset sekä säädöstenmukaisuuden näkökulmat. Käytännössä datasetin ominaisuudet
Datasetin ominaisuuksia kartoitetaan usein datakatalogeissa ja metatietokannoissa, ja niihin voidaan soveltaa standardeja kuten DCAT-AP. Ymmärrys datasetin