Dataintensiivisyys
Dataintensiivisyys kuvaa järjestelmiä ja prosesseja, joissa toiminnallisuus ja suorituskyky riippuvat suurelta osin datan määrästä, datan virroista sekä sen hallinnan laadusta. Käytännössä dataintensiiviset sovellukset keräävät, tallentavat, siirtävät ja käsittelevät suuria määriä dataa nopeasti, jolloin infrastruktuuri ja tietojen laadun hallinta muodostuvat kriittisiksi tekijöiksi. Tällainen lähestymistapa esiintyy erityisesti suurten datakokonaisuuksien analyysissä, reaaliaikaisessa stream- ja koneoppimisessa.
Ominaisuuksiin kuuluu massiivinen datamäärä, korkea läpivirta sekä hajautettu laskenta ja skaalautuvuus. Dataintensiivisyyden ratkaisuissa hyödynnetään usein datalake-arkkitehtuuria
Haasteita ovat kustannusten hallinta, tallennus- ja siirtokustannukset sekä viiveet, tietoturva ja yksityisyys, säilyttämisen vaatimukset ja lainsäädäntö
Käyttökohteita ovat muun muassa telekommunikaatio, verkkopalvelut ja IoT, teollisuus 4.0, biotieteet sekä ilmasto- ja ympäristötutkimus. Dataintensiivisyys
Arkkitehtuurilta dataintensiiviset järjestelmät painottavat data- ja laskentatehon läheistä yhteistoimintaa. Tällöin käytetään data-centric arkkitehtuuria, datalake- ja datavarastoratkaisuja