MapReducepõhiseid - Infinite Lexicon - Infinite Lexicon

MapReducepõhiseid

MapReducepõhised süsteemid tähistavad andmete töötlemise arhitektuuri, mis põhineb MapReduce paradigmil. Need süsteemid töötlevad suurandmeid hajutatult klastris, jagades töö kaheks peamiseks faasiks: map ja reduce. Sisend loetakse võtme-väärtuse paaridena; Map-faasis luuakse uusi võtme-väärtuse paare, mille järel toimub vahevõtmete (shuffle) sorteerimine ja grupeerimine, ning Reduce-faasis koondatakse või teisendatakse väärtused lõpp-tulemusteks.

Omadused ja tööpõhimõtted: MapReducepõhised süsteemid on skaleeritavad ja taluvad vigade ilmnemist tänu andmete replikatsioonile ning automaatsele

Tüüpilised kasutusvaldkonnad hõlmavad suurte logide analüüsi, veebisisu indekseerimist, ETL-protsesse ja suurandmete arhiveerimist. Kuna tegemist on partiitöötlusega

Ajalugu: Google tutvustas MapReduce ideed 2004. aastal teadusartiklites; avatud lähtekoodina Hadoop arendati 2000ndate lõpus ja 2010-ndatel

failisüsteemis

Programmeerimine

võtme-väärtuse

töötlemiseks.