Datenaugmentation - Infinite Lexicon - Infinite Lexicon

Datenaugmentation

Datenaugmentation bezeichnet in der Praxis des maschinellen Lernens den Prozess, durch Transformationen oder Generierung neuer Beispiele aus vorhandenen Daten zusätzliche Trainingsdaten zu schaffen. Ziel ist eine bessere Generalisierung von Modellen, besonders wenn der ursprüngliche Datensatz klein, unausgeglichen oder schwer zu beschaffen ist. Datenaugmentation kommt in überwachten, unüberwachten oder semiüberwachten Lernsettings zum Einsatz.

Typische Verfahren hängen vom Datentyp ab. Bei Bilddaten umfassen sie geometrische Transformationen wie Rotation, Spiegeln, Zuschneiden

Fortgeschrittene Ansätze nutzen modellbasierte Generierung, um plausible synthetische Daten zu erzeugen, die die Verteilung der echten

Anwendungsfelder reichen von Computer Vision und Spracherkennung über Medizin, Zeitreihenanalyse bis hin zu Sensorik. Durch Datenaugmentation

Farbveränderungen

Synonymersetzungen,

Back-Translation

Tempoänderungen,

Zeitverschiebungen

Zufallsabweichungen,

fortgeschrittene

Generierungsmethoden

Diffusionsmodelle

On-the-fly-Augmentierung

Rechenressourcen

Transformationen,

Vertraulichkeitsprobleme,

wiederhergestellt

Klassenausgleiche