Datasættet
Datasættet er en systematisk samling af data, ofte organiseret i tabelform med rækker og kolonner. Hver række er en enhed eller observation, mens kolonnerne angiver variabler eller attributter. Datasættet kan være små eller store og bruges inden for videnskab, erhverv og forvaltning.
Et datasæt består af dataelementer, værdier og metadata. Data kan være numeriske, kategoriske eller tekstbaserede og
Vigtige aspekter af datakvalitet er fuldstændighed, konsistens, nøjagtighed, aktualitet og unikhed. Provenance beskriver oprindelsen og ændringerne
Datasæt bruges i dataanalyse, statistik, maskinlæring og beslutningsstøtte. Deling og anvendelse kræver ofte privatlivsbeskyttelse og overholdelse
Eksempler inkluderer offentlige statistiske datasæt, vejrdata og virksomheders kundedatabaser. Et veludviklet datasæt er dokumenteret og let