Home

datalähteitä

Datalähteet ovat kaikki aineistot ja rekisterit, joista hankitaan dataa tutkimukseen, suunnitteluun tai päätöksentekoon. Ne voivat olla primaarilähteitä, joita kerää itse tekijä, tai sekundaarilähteitä, jotka koostavat tai julkaisevat muiden keräämää dataa. Lähteet voivat olla strukturoitua dataa taulukoineen tai jäsentymätöntä kuten tekstiä, kuvia ja videoita.

Primaarilähteet: oman aineiston keräys (kyselyt, havainnot, kokeet). Sekundaarilähteet: tilastot, rekisterit, julkaisut, avoimet datasetit sekä kaupalliset datat.

Laatu ja jäljitettävyys ovat keskeisiä: metatiedot, alkuperä, keräystavat, aikaleimat ja muokkaukset. Datan laatuun vaikuttavat tarkkuus, täyteys,

Käyttö ja hallinta: lisenssit ja käyttöoikeudet sekä pääsyrajoitukset. Avoin data edistää replikointia, kun taas rajoitetut datat

ajantasaisuus,
johdonmukaisuus
sekä
mahdolliset
mittaus-
tai
otantavirheet
ja
vinoumat.
Henkilötietojen
käsittelyssä
on
noudatettava
tietosuojaa.
voivat
vaatia
neuvotteluja.
Datan
yhdistäminen
useista
lähteistä
vaatii
läpinäkyvää
provenancea
ja
yhteensopivia
metatietoja.