andmekomplektist
Andmekomplekt on kogum andmeid, mis on kogutud või genereeritud kindla eesmärgiga. Tavaliselt koosneb see ridadest ja veergudest, kus iga rida kirjeldab ühte üksust ning veerud määratlevad selle omadused. Lisaks sisaldab andmekomplekt metadata, mis kirjeldab andmete päritolu, kogumise kuupäevad, kvaliteedi, struktuuri ja kasutustingimusi.
Andmekomplektid võivad olla struktureeritud, osaliselt struktureeritud või mitte-struktureeritud. Struktureeritud andmed esitatakse sageli tabelina (nt CSV, Excel),
Kogumine ja kvaliteet on olulised aspektid. Andmekomplekti kvaliteet sõltub kättesaadavusest, kattuvusest, vigade ning puuduvate väärtuste käsitlemisest.
Seaduslik ja eetiline raamistik hõlmab isikuandmete kaitset, anonimeerimist, nõusolekut ning litsentsi või kasutustingimusi. Litsentsidel nähakse sageli
Kasutusvaldkonnad hõlmavad masinõpet, statistikat, teadust, tööstust ning haridust. Reprodutseerimise tagamiseks on vajalik versioonijälgitavus, metadata ja kirjeldused