dataforsterkning
Dataforsterkning, ofte referert til som dataaugmentasjon, er en gruppe teknikker i maskinlæring som øker størrelsen og variasjonen av treningsdata uten å innhente nye observasjoner. Målet er å forbedre modellens generalisering og robusthet ved å gjøre den mindre avhengig av små variasjoner i treningssettet.
Metoder inkluderer blant annet:
- Bildebasert forsterkning: geometriske transformasjoner som rotering, speiling, beskjæring og skalering; fargejustering, støy og lysforhold; samt mer
- Tale og lyd: endre hastighet eller tonehøyde, legge til støy eller bakgrunnslyder.
- Tekst og NLP: synonymutskifting, tilfeldig setningsendring, tilfeldig ordbytte, back-translation og parafrase.
- Syntetisk data: generative modeller som GANs eller VAEs som skaper nye bilder eller andre data; simulering
Anvendelser omfatter bildeklassifisering og objektdeteksjon, tale- og språkmodelltrening, samt medisinske bilder og andre felt der innsamling
Verktøy og rammeverk som PyTorch og TensorFlow støtter forsterkning gjennom egne transformasjoner, og det finnes bibliotek