Home

MultiLabelKlassifikation

Multi-Label-Klassifikation ist eine Form des maschinellen Lernens, bei der jedem Beispiel mehrere Etiketten gleichzeitig zugeordnet werden können. Im Gegensatz zur Multi-Klassen-Klassifikation, bei der nur ein Label pro Instanz gewählt wird, zielt sie darauf ab, alle relevanten Labels für eine Eingabe zu identifizieren.

Formell bezeichnet man Trainingsdaten D = { (x_i, y_i) } mit x_i ∈ R^d und y_i ∈ {0,1}^L, wobei L die

Typische Ansätze fallen in zwei Kategorien: Problem-Transformationen wie Binary Relevance (BR), Classifier Chains (CC) und Dependent

Die Leistung wird mit speziellen Metriken bewertet, darunter Hamming Loss, exakte Übereinstimmung (Subset-Accuracy) sowie Precision, Recall

Anwendungsgebiete umfassen die Textklassifikation, Bild- und Audio-Tagging, Bioinformatik sowie Empfehlungssysteme, in denen Objekte mehreren Kategorien, Funktionen

Herausforderungen umfassen unausgeglichene Label-Verteilungen, Abhängigkeiten zwischen Labels, große Labelräume, fehlende oder verrauschte Labels sowie Skalierungs- und

Anzahl
möglicher
Labels
ist.
Die
Aufgabe
besteht
darin,
eine
Funktion
f
zu
lernen,
die
Eingaben
x
auf
einen
Binärvektor
y
∈
{0,1}^L
abbildet
oder
eine
Wahrscheinlichkeitsverteilung
P(y|x)
liefert.
Binary
Relevance,
die
das
Problem
in
mehrere
Binärklassifikationsaufgaben
überführt;
und
Algorithmus-Adaption,
bei
der
vorhandene
Klassifikatoren
wie
SVMs,
Entscheidungsbäume
oder
neuronale
Netze
direkt
für
Multi-Label-Probleme
angepasst
werden.
Ensemble-Methoden
werden
häufig
eingesetzt,
um
Abhängigkeiten
zwischen
Labels
zu
berücksicht.
und
F1-Score,
oft
gemittelt
als
mikro-
oder
makro-Quoten.
Die
Wahl
der
Metriken
hängt
von
Anwendungen
und
Labelverteilungen
ab.
oder
Eigenschaften
zugeordnet
werden
müssen.
Interpretationsprobleme
bei
großen
Datensätzen.