Datenaugmentation
Datenaugmentation bezeichnet in der Praxis des maschinellen Lernens den Prozess, durch Transformationen oder Generierung neuer Beispiele aus vorhandenen Daten zusätzliche Trainingsdaten zu schaffen. Ziel ist eine bessere Generalisierung von Modellen, besonders wenn der ursprüngliche Datensatz klein, unausgeglichen oder schwer zu beschaffen ist. Datenaugmentation kommt in überwachten, unüberwachten oder semiüberwachten Lernsettings zum Einsatz.
Typische Verfahren hängen vom Datentyp ab. Bei Bilddaten umfassen sie geometrische Transformationen wie Rotation, Spiegeln, Zuschneiden
Fortgeschrittene Ansätze nutzen modellbasierte Generierung, um plausible synthetische Daten zu erzeugen, die die Verteilung der echten
Anwendungsfelder reichen von Computer Vision und Spracherkennung über Medizin, Zeitreihenanalyse bis hin zu Sensorik. Durch Datenaugmentation