GPUarkitektur
GPU-arkitektur beskriver hur grafikkort är uppbyggda för hög genomströmning, särskilt i parallella dataarbetsbelastningar som grafik och GPGPU. Till skillnad från CPU:er består GPU:er av många mindre kärnor och ett högt bandbreddminne, vilket möjliggör massiv parallellism. De modernaste arkitekturerna varierar mellan tillverkare men strävar efter att dölja latens och mata exekveringsenheterna effektivt med data.
Centrala byggstenar är ett stort antal bearbetningsenheter organiserade i streaming multiprocessors eller compute units. Varje SM/CU
Exekveringsmodellen är deterministisk i sin struktur men flexibel i körning: trådar körs i grupper (NVIDIA-språket kallat
Minneshierarki: globalt minne är stort men långsamt; cacheminnen (L1/L2) och snabbt delat minne eller lokalt minne
Programmering och optimering görs vanligtvis via CUDA, OpenCL eller genom compute shaders i DirectX/Vulkan. Viktiga optimeringsområde
Trenderna i GPU-arkitektur inkluderar specialenheter som tensor-kärnor för AI, dedikerade ray tracing-kärnor och stöd för heterogen