datavirtaa
Datavirta tarkoittaa tiedon liikkumista ja muuttamista järjestelmissä sekä sen siirtämistä eri prosessien, tallennustilojen ja rajapintojen välillä. Datavirran suunnittelussa kiinnitetään huomiota siihen, miten data syntyy, miten sitä siirretään, missä sitä käsitellään ja miten se tallennetaan. Tavoitteena on varmistaa, että data on käytettävissä, laadukasta ja helposti käytettävissä eri sovelluksissa ja päätöksenteossa.
Datavirtaa tarkastellaan usein arkkitehtuureittain. Yleisimmät mallit ovat batch- ja streaming- eli reaaliaikainen datankäsittely. Näissä muodostuu data-pipelineja,
Tietojen liikkeen mallintamiseen käytetään usein data flow -diagrammeja, joissa esitetään prosessit, ulkoiset entiteetit, tiedon säilytystilat ja
Datavirta-ajatusta sovelletaan laajasti ohjelmistokehityksessä, suurten tietomassojen käsittelyssä sekä reaaliaikaisessa analytiikassa. Keskeisiä käsitteitä ovat ETL- ja ELT-prosessit,
Haasteita datavirrassa ovat viiveet, kapasiteettitarpeet sekä laadun, yksityisyyden ja turvallisuuden hallinta. Myös datan lineage ja läpinäkyvyys