datajakautuminen
Datajakautuminen on prosessi, jossa suuret datamassat jaetaan pienempiin, hallittavimpiin osiin tai lohkoihin. Tavoitteena on parantaa skaalautuvuutta, suorituskykyä ja hallittavuutta sekä vähentää tiedon hakemisen viivettä. Datajakautumista käytetään erityisesti hajautetuissa tallennus- ja laskentajärjestelmissä sekä suurten datavirtojen käsittelyssä.
Tyypit ja hakutoimenpiteet vaihtelevat käyttötarkoituksen mukaan. Yleisiä lähestymistapoja ovat hash-pohjainen partitionointi, jossa avaimet hajautetaan ja jaetaan
Sovellukset ja vaikutukset ovat laajat. NoSQL-tietokannat kuten Cassandra ja HBase käyttävät avainpohjaista partitionointia suurten datamassojen skaalaukseen.
Käytännössä datajakautuminen voi olla osa järjestelmäkohtaista toteutusta tai se voi olla kokonainen arkkitehtuurin periaate. Replikointi ja