datasätt
Datasätt är en samling data som används för analys, forskning eller modellering. Vanligtvis organiseras de i strukturerade former där varje rad motsvarar en observation och varje kolumn en variabel. Datasätt kan också vara ostrukturerade eller semistrukturerade, exempelvis textfiler, bilder eller tidsserier. De flesta datasätt åtföljs av metadata som beskriver innehållet, variablernas namn, datatyper och enheter.
Alla datasätt genomgår en livscykel som omfattar insamling, rensning, förbehandling och dokumentation. Insamlingen avgör urval, metod
Kvalitet bedöms vanligtvis utifrån fullständighet, noggrannhet, konsekvens, aktualitet och representativitet. Etiska och juridiska frågor är centrala,
Användning och tillgång: Datasätt används för statistisk analys, maskininlärning, benchmarking och forskning. De tillhandahålls ofta av