Tensorkjerner - Infinite Lexicon - Infinite Lexicon

Tensorkjerner

Tensorkjerner er specialiserede beregningsenheder i nyere NVIDIA-GPU’er, der accelererer matrixmultiplikation og akkumulering, grundlæggende operationer i kunstig intelligens og maskinlæring. Ved at udføre mange parallelle små matrixmultiplikationer i høj gennemløb muliggør de hurtig træning og inferens med lavere præcision end fuld FP32-nøjagtighed.

Historie og udvikling: Tensor Cores blev introduceret i Volta-arkitekturen (GV100) og er siden forbedret i Turing,

Sådan virker de: Tensor Cores udfører matrixmultiplikation og akkumulering i blokke af små matricer. Programmører får

Anvendelse og betydning: Tensor Cores er centrale for moderne dyb læring på NVIDIA-GPU’er og især gavnlige for

Begrænsninger: Udnyttelse kræver kompatibel software og dataparametre; ikke alle operationer får hastighedsforbedring, og præcision/ferdigheder skal afvejes.

matrixblokstørrelser

hukommelsesadgang.

akkumulationsformater,

transformerbaserede

matrixoperationer

batch-størrelser

træning/inferens