GPUarkitektur - Infinite Lexicon - Infinite Lexicon

GPUarkitektur

GPU-arkitektur beskriver hur grafikkort är uppbyggda för hög genomströmning, särskilt i parallella dataarbetsbelastningar som grafik och GPGPU. Till skillnad från CPU:er består GPU:er av många mindre kärnor och ett högt bandbreddminne, vilket möjliggör massiv parallellism. De modernaste arkitekturerna varierar mellan tillverkare men strävar efter att dölja latens och mata exekveringsenheterna effektivt med data.

Centrala byggstenar är ett stort antal bearbetningsenheter organiserade i streaming multiprocessors eller compute units. Varje SM/CU

Exekveringsmodellen är deterministisk i sin struktur men flexibel i körning: trådar körs i grupper (NVIDIA-språket kallat

Minneshierarki: globalt minne är stort men långsamt; cacheminnen (L1/L2) och snabbt delat minne eller lokalt minne

Programmering och optimering görs vanligtvis via CUDA, OpenCL eller genom compute shaders i DirectX/Vulkan. Viktiga optimeringsområde

Trenderna i GPU-arkitektur inkluderar specialenheter som tensor-kärnor för AI, dedikerade ray tracing-kärnor och stöd för heterogen

genomströmning

tidsmultiplexering.

effektiviteten.

Minnesåtkomstmönster

förfrågningar

minnesanvändning,

grenbetingelser

i

högpresterande

datoranvändning