datankeruulähteitä
Datankeruulähteitä ovat ne lähteet, joista kerätään dataa tutkimus- ja analyysitarkoituksiin sekä päätöksenteon tukemiseksi. Lähteet voivat olla primaarisia, eli data kerätään itse esimerkiksi kyselyillä, kokeilla, havainnoimalla tai haastattelemalla, sekä sekundaarisia, joissa data on jo olemassa ja saatavilla muilta tahoilta.
Primaarisia datankeruulähteitä voivat olla kyselyt, kokeet, havainnot, haastattelut sekä sensoridatat ja laitteen tai sovelluksen lokit. Sekundaarisia
Esimerkkejä datankeruulähteistä ovat tilastotiede- ja sosiaalitieteissä käytetyt kyselyt ja kokeet; teollisuus- ja älykotien IoT-sensoridataa; liiketoiminnassa transaktiotiedot
Datan keruussa on kiinnitettävä huomiota laatuun, kattavuuteen ja ajantasaisuuteen sekä virheisiin, puuttuvaan dataan ja mittauslihavuuteen. Tutkimuksessa
Datanhallinta ja -provenienssi tarkoittavat metatietojen, alkuperän jäljittämisen ja datan elinkaaren hallintaa. Hyvin dokumentoidut datankeruulähteet tukevat toistettavuutta,