dataförstärkning
Dataförstärkning, eller data augmentation, är en teknik inom maskininlärning som ökar mängden och mångfalden av träningsdata genom att modifiera befintliga exempel eller generera nya syntetiska exempel. Syftet är att förbättra modellernas generalisering och robusthet utan att samla in nya data i verkligheten.
Vanliga metoder varierar mellan domäner. Inom datorseende används bildtransformationer som rotation, spegling, beskärning, färgjustering, brus och
Fördelar inkluderar minskad risk för överanpassning, bättre prestanda på små eller obalanserade datamängder och ökad motståndskraft
Praktiska överväganden omfattar hur stark augmentationen ska vara, om den körs online under träning eller offline
Användningsområden inkluderar datorseende, naturlig språkbehandling och talbearbetning, där dataförstärkning är särskilt användbart i datafattiga eller varierande