dataparallellisme
Dataparallellisme is een benadering binnen het gebied van parallel computing waarbij dezelfde bewerking op verschillende stukken data gelijktijdig wordt uitgevoerd. Het idee is dat de dataset in meerdere partities wordt verdeeld en elke verwerker dezelfde programmacode uitvoert op een andere data-set. Hierdoor kunnen meerdere berekeningen tegelijk plaatsvinden, wat de rekentijd bij grote datasets aanzienlijk kan verlagen.
Het onderscheid met taakparallellisme ligt in de aard van de workload. Bij data-parallelisme voert elke processor
Typische implementaties omvatten vectorprocessors en SIMD-instructies, moderne grafische kaarten (GPUs) met CUDA of OpenCL, en multi-core
Toepassingen komen veel voor in machine learning, beeld- en signaalverwerking, en wetenschappelijke simulaties, waar grote datasets
Uitdagingen zijn onder meer de partitionering en load balancing van data, communicatie-overhead bij het samenvoegen van