Andmekomplekte
Andmekomplekt on süsteemselt kogutud andmeridade kogum, mis on seotud kindla teema või uurimisvaldkonnaga. Iga kirje kirjeldab üht näidet ning iga tunnus annab selle näite kohta mõõdetava omaduse. Andmekomplektidega töötatakse tavaliselt andmeteaduse, statistika ja masinõppe kontekstis.
Andmekomplektid võivad olla struktureeritud (tabelid CSV või Excel), poolstruktureeritud (JSON, XML) või mittestruktureeritud (pildid, helid, tekst).
Kvaliteet ja korraldus on andmekomplekti töös keskendunud teema. Olulised omadused on täpsus, täielikkus, järjepidevus, ajakohasus ja
Kasutusvaldkonnad hõlmavad masinõpet, statistilist analüüsi, andmeanalüüsi, modelleerimist ja baasteadmisi teaduslikes uuringutes. Hea praktikaga kaasneb järgitavus ja
Õiguslik ja eetiline külg on olulised. Isikuandmete kaitse, anonüüsimine ja nõusolek on prioriteedid ning andmekäitlemine tuleb