MultiLabelKlassifikation - Infinite Lexicon - Infinite Lexicon

MultiLabelKlassifikation

Multi-Label-Klassifikation ist eine Form des maschinellen Lernens, bei der jedem Beispiel mehrere Etiketten gleichzeitig zugeordnet werden können. Im Gegensatz zur Multi-Klassen-Klassifikation, bei der nur ein Label pro Instanz gewählt wird, zielt sie darauf ab, alle relevanten Labels für eine Eingabe zu identifizieren.

Formell bezeichnet man Trainingsdaten D = { (x_i, y_i) } mit x_i ∈ R^d und y_i ∈ {0,1}^L, wobei L die

Typische Ansätze fallen in zwei Kategorien: Problem-Transformationen wie Binary Relevance (BR), Classifier Chains (CC) und Dependent

Die Leistung wird mit speziellen Metriken bewertet, darunter Hamming Loss, exakte Übereinstimmung (Subset-Accuracy) sowie Precision, Recall

Anwendungsgebiete umfassen die Textklassifikation, Bild- und Audio-Tagging, Bioinformatik sowie Empfehlungssysteme, in denen Objekte mehreren Kategorien, Funktionen

Herausforderungen umfassen unausgeglichene Label-Verteilungen, Abhängigkeiten zwischen Labels, große Labelräume, fehlende oder verrauschte Labels sowie Skalierungs- und

f

x

y

∈

Wahrscheinlichkeitsverteilung

Binärklassifikationsaufgaben

Algorithmus-Adaption,

Klassifikatoren

Entscheidungsbäume

Multi-Label-Probleme

Ensemble-Methoden

Abhängigkeiten

Labelverteilungen

Interpretationsprobleme