datatuotanto
Datatuotanto on prosessi, jossa syntyy, kerätään ja valmistellaan dataa sen käyttötarkoituksia varten. Tämä kattaa tiedon hankinnan erilaisista lähteistä (kyselyt, sensorit, verkkosivujen data, julkiset tietoaineistot sekä organisaatioiden omat tietovarastot), laadunvarmistuksen, puhdistamisen, yhdistämisen sekä tallennuksen ja jakelun. Datatuotanto muodostaa usein osan laajempaa data- tai tietohallintoarkkitehtuuria ja palvelee tutkimusta, päätöksentekoa, liiketoimintaa sekä journalistista ja julkista viestintää.
Prosessin keskeisiä vaiheita ovat suunnittelu ja tiedonmallinnus, tiedon kerääminen ja integrointi, laadunvarmistus ja puhdistus, muokkaus ja
Käyttökohteita ovat muun muassa tieteellinen tutkimus, päätöksentekoa tukevat rakenteet, liiketoiminnan analyysi, datajournalismi ja julkisen sektorin palveluiden
Taitovaatimuksiin kuuluu ohjelmointikielen hallinta (esimerkiksi Python tai R), SQL-tiedonhallinta, tietokannat ja pilvi-ympäristöt sekä kokemus data-arkkitehtuureista, versionhallinnasta