förträning

Förträning, eller pretraining, är en fas där en modell eller ett system utsätts för bred träning på stora mängder data innan den specialiseras genom finjustering mot en eller flera specifika uppgifter. Syftet är att lära generella representationer och funktioner som kan överföras till nya uppgifter med mindre domänspecifik data.

Typisk pipeline: samla in stort korpus, definiera en generisk uppgift (t.ex. självövervakad uppgift som masker i

Vanliga språkmodeller förtränas via maskerad språkmodellering (BERT-liknande) eller autoregressiv modellering (GPT-liknande). I bild- och multimodala modeller

Termen företräning återfinns mest i tekniska sammanhang som maskininlärning och artificiell intelligens; inom idrott och utbildning

i

generalisering,

dataeffektivitet

beräkningskapacitet

självövervakade

transformatorrepresentationer.

i