DLModelle
DLModelle, oder Deep-Learning-Modelle, sind computergestützte Modelle, die aus großen Mengen an Daten hierarchische Repräsentationen lernen, indem sie tiefe neuronale Netze verwenden. Sie werden typischerweise durch Backpropagation trainiert, wobei Optimierer wie Stochastic Gradient Descent oder Adam eingesetzt werden. Dazu benötigt man umfangreiche Rechenressourcen, oft GPUs oder TPUs, und große Datensätze.
Architekturen umfassen Feedforward-Netze, Convolutional Neural Networks, Recurrente Netze und Transformatoren. Diese Architekturen unterscheiden sich in Struktur,
Anwendungsgebiete reichen von Bild- und Spracherkennung über Natural Language Processing bis hin zu Generierung, Empfehlungssystemen und
Im Betrieb wird zwischen Training und Inferenz unterschieden. Inferenz erfolgt oft mit reduzierter Präzision, Quantisierung oder
Historisch markante Meilensteine sind der Durchbruch von Deep-Learning-Ansätzen mit großen Bilddatensätzen und die Entwicklung von Transformern