Home

Mehrklassenproblemen

Mehrklassenprobleme, auch als multiclass classification bezeichnet, gehören zum Bereich des überwachten Lernens. In diesen Aufgaben wird jedes Beispiel einer einzigen Klasse aus einer festen Menge von K Klassen zugeordnet, wobei K größer als 2 ist. Die Zielvariable ist diskret und hat mehrere mögliche Werte. Typische Anwendungen finden sich in der Bild- und Textklassifikation, der Spracherkennung und der Biomedizin.

Die Modelle schätzen für eine Eingabe x eine Wahrscheinlichkeitsverteilung über die Klassen p(y=k|x). Häufig wird eine

Zu den gängigen Lernstrategien gehören OvR (One-vs-Rest), bei dem K binäre Klassifikatoren trainiert werden, OvO (One-vs-One),

Wichtige Evaluationsmaße sind Genauigkeit, macro- und micro-aggregierte F1-Scores, die Verwechslungsmatrix und, falls sinnvoll, ROC-AUC pro Klasse.

Softmax-Funktion
verwendet,
um
Wahrscheinlichkeiten
zu
erzeugen.
Daneben
existieren
lineare
Ansätze
wie
die
multinomiale
logistische
Regression,
sowie
nichtlineare
Modelle
wie
neuronale
Netze,
Entscheidungsbäume
und
Ensemble-Methoden
wie
Random
Forest
oder
Gradient
Boosting.
Bei
Support-Vector-Machines
werden
üblicherweise
One-vs-Rest-
oder
One-vs-One-Strategien
eingesetzt,
um
mehrere
Klassen
abzuleiten.
bei
dem
alle
Klassenpaare
gegeneinander
auftreten,
und
ECOC
(Error-Correcting
Output
Codes),
das
zusätzliche
Robustheit
durch
Codesysteme
bietet.
Bei
großen
K
können
diese
Strategien
rechnerisch
anspruchsvoll
werden,
weshalb
oft
spezialisierte
Implementierungen
oder
hierarchische
Modelle
genutzt
werden.
Wichtige
Herausforderungen
sind
Klassenungleichgewicht,
hohe
Dimensionalität
der
Merkmale,
Rauschen
und
Überanpassung.
Im
Unterschied
zu
Mehrfach-Labels,
bei
denen
mehrere
Klassen
pro
Instanz
zutreffen
können,
bezeichnet
Mehrklassenprobleme
eine
eindeutige
Zuordnung
jeder
Instanz
zu
einer
einzigen
Klasse.