andmestik
Andmestik on statistikas või teadustöödes kasutatav andmekogum, mis koosneb üksustest ja muutujatest. Iga kirje (rida) kirjeldab ühte üksust (nt inimest, objekti või sündmust) ning iga veerg kirjeldab muutujat (nt vanus, sugu, temperatuur). Muutujad võivad olla numbrilised (nt vanus) või kategoriseeritud (nt sugu, rahvus). Andmestik tavaliselt kujutab endast tabeli, mida võib salvestada vormingutes nagu CSV, Excel või SQL-andmebaas; keerukamad andmestikud võivad hõlmata mitut tabelit või hierarhilisi struktuure.
Andmestikke kogutakse või koostatakse erinevatel viisidel: uuringutest, eksperimentidest, haldusandmetest (nt registrid), sensorandmetest ja veebilogidest. Üldjuhul eristatakse
Kvaliteet ja töötlemine sõltuvad puuduvate väärtuste, vigade, duplikaatide ja mõõtmisvääride käsitlemisest. Enne analüüsi tehakse andmete puhastus,
Andmestikke kasutatakse statistilisel analüüsil, masinõppel, andmete visualiseerimisel ja aruandluses. Eetilised ja privaatsusega seotud kaalutlused hõlmavad isikuandmete