Datalähteinä
Datalähteinä tarkoitetaan tietoa tuottavia tai tallentavia lähteitä, joita käytetään analyysiin, tutkimukseen, päätöksentekoon ja sovellusten kouluttamiseen. Käsite kattaa sekä alkuperäiset (primaariset) lähteet, kuten kenttämittaukset, kyselyt ja sensoridatat, että toissijaiset lähteet, kuten tilastot, arkistoidut raportit ja muiden tekemiin kokoelmiin perustuvat tietokannat.
Datalähteiden tyypillisiä esimerkkejä ovat hallinnolliset rekisterit, tieteelliset aineistot, liikenneseuranta, IoT-laitteet, sosiaalisen median syötteet, avoin data ja
Datalähteiden integrointi edellyttää metatietoja, yhtenäisiä muotoja ja interoperabiliteettistandardeja. Laadunvarmistus sisältää puhdistuksen, normalisoinnin ja virheiden tunnistamisen sekä
Datalähteinä toimivat sekä julkiset että yksityiset resurssit, ja niiden merkitys kasvaa datalähtöisen päätöksenteon ja koneoppimisen yleistyessä.