datalähteestä
Datalähteestä viittaa siihen paikkaan tai järjestelmään, josta data on peräisin. Datan alkuperä on keskeinen tekijä datan luotettavuudessa, jäljitettävyydessä ja käytettävyydessä. Datalähteet voivat olla sisäisiä, kuten yrityksen transaktiotietokanta tai tuotantojärjestelmä, tai ulkoisia, kuten tilastoviraston julkaisut, avoimet datasetit tai kolmansien osapuolten API-rajapinnat. Datan lähteen kuvaaminen ja dokumentointi muodostaa datan provenanceen, joka kertoo, mistä data on peräisin, miten se on kerätty, millä aikavälillä ja millä laadunvarmistuksilla.
Tiedonhallinnan näkökulmasta datalähteet tulisi hallita metatietojen avulla: lähteen nimi, omistaja, keräystapa, päivitystiheys, fyysinen tai looginen sijainti
Yleisiä haasteita ovat tiedon laatu, epäyhtenäiset muodot, puuttuvat arvot sekä pääsyn- ja yksityisyydenhallinta. Hyvät käytännöt sisältävät