dataaugmentering

Dataaugmentering is een verzamelnaam voor technieken die de hoeveelheid en variatie van trainingsdata kunstmatig vergroten door bestaande voorbeelden te transformeren of aan te vullen. Het doel is de dataset robuuster te maken voor nieuwe, ongeziene data, zodat modellen beter generaliseren en minder snel overfitten.

Toepassingsgebieden zijn breed. In machine learning wordt dataaugmentering veel toegepast bij beeld- en spraakherkenning, maar ook

Veelgebruikte methoden zijn afhankelijk van het type data. Voor beelddata omvatten ze rotaties, flips, croppen, schaal-

Implementatie vereist aandacht voor labelintegriteit en realiteitswaarde. Transformaties moeten de betekenis van de input niet veranderen,

taalverwerking,

belichtingsverschillen

translatie-transformaties,

back-translation

schaalveranderingen,

tijdsverschuivingen

diffusie-modellen