MultiLabelKlassifikation
Multi-Label-Klassifikation ist eine Form des maschinellen Lernens, bei der jedem Beispiel mehrere Etiketten gleichzeitig zugeordnet werden können. Im Gegensatz zur Multi-Klassen-Klassifikation, bei der nur ein Label pro Instanz gewählt wird, zielt sie darauf ab, alle relevanten Labels für eine Eingabe zu identifizieren.
Formell bezeichnet man Trainingsdaten D = { (x_i, y_i) } mit x_i ∈ R^d und y_i ∈ {0,1}^L, wobei L die
Typische Ansätze fallen in zwei Kategorien: Problem-Transformationen wie Binary Relevance (BR), Classifier Chains (CC) und Dependent
Die Leistung wird mit speziellen Metriken bewertet, darunter Hamming Loss, exakte Übereinstimmung (Subset-Accuracy) sowie Precision, Recall
Anwendungsgebiete umfassen die Textklassifikation, Bild- und Audio-Tagging, Bioinformatik sowie Empfehlungssysteme, in denen Objekte mehreren Kategorien, Funktionen
Herausforderungen umfassen unausgeglichene Label-Verteilungen, Abhängigkeiten zwischen Labels, große Labelräume, fehlende oder verrauschte Labels sowie Skalierungs- und