datalähteitä
Datalähteet ovat kaikki aineistot ja rekisterit, joista hankitaan dataa tutkimukseen, suunnitteluun tai päätöksentekoon. Ne voivat olla primaarilähteitä, joita kerää itse tekijä, tai sekundaarilähteitä, jotka koostavat tai julkaisevat muiden keräämää dataa. Lähteet voivat olla strukturoitua dataa taulukoineen tai jäsentymätöntä kuten tekstiä, kuvia ja videoita.
Primaarilähteet: oman aineiston keräys (kyselyt, havainnot, kokeet). Sekundaarilähteet: tilastot, rekisterit, julkaisut, avoimet datasetit sekä kaupalliset datat.
Laatu ja jäljitettävyys ovat keskeisiä: metatiedot, alkuperä, keräystavat, aikaleimat ja muokkaukset. Datan laatuun vaikuttavat tarkkuus, täyteys,
Käyttö ja hallinta: lisenssit ja käyttöoikeudet sekä pääsyrajoitukset. Avoin data edistää replikointia, kun taas rajoitetut datat