GPUspesifikke
GPU-spesifikke refererer til kode, algoritmer og optimeringer som er tilpasset grafikkprosessorens (GPU) unike arkitektur og minnefunksjon. Slike teknikker fokuserer på å utnytte massiv parallellisme og rask tilgang til minne, og er ofte designet for oppgaver som kan deles opp i mange samtidige operasjoner, slik som bildebehandling, simulering og maskinlæring.
En GPU består av mange små kjerner og en minnearkitektur som inkluderer globalt minne, delt minne og
Typiske teknikker inkluderer data-layout som SoA (structure of arrays), minnekoalescens for effektivt gjennomløp av globalt minne,
Fordelene inkluderer høy flops-per-watt og stor minnebåndbredde for parallelle arbeidsmengder. Utfordringer omfatter portabilitet mellom ulike GPU-arkitekturer