Tensorkjerner
Tensorkjerner er specialiserede beregningsenheder i nyere NVIDIA-GPU’er, der accelererer matrixmultiplikation og akkumulering, grundlæggende operationer i kunstig intelligens og maskinlæring. Ved at udføre mange parallelle små matrixmultiplikationer i høj gennemløb muliggør de hurtig træning og inferens med lavere præcision end fuld FP32-nøjagtighed.
Historie og udvikling: Tensor Cores blev introduceret i Volta-arkitekturen (GV100) og er siden forbedret i Turing,
Sådan virker de: Tensor Cores udfører matrixmultiplikation og akkumulering i blokke af små matricer. Programmører får
Anvendelse og betydning: Tensor Cores er centrale for moderne dyb læring på NVIDIA-GPU’er og især gavnlige for
Begrænsninger: Udnyttelse kræver kompatibel software og dataparametre; ikke alle operationer får hastighedsforbedring, og præcision/ferdigheder skal afvejes.