Labelgenauigkeit
Labelgenauigkeit bezeichnet den Anteil der korrekt zugewiesenen Labels in einem Datensatz im Verhältnis zum wahren Label oder einem festgelegten Goldstandard. Sie misst, wie gut die Annotationen die tatsächliche Klasse oder Kategorie widerspiegeln. In der Praxis dient sie als zentrale Größenordnung für die Qualität von Trainingsdaten; eine geringe Labelgenauigkeit kann zu verzerrten Modellen und unzuverlässigen Evaluationen führen.
Die Messung erfolgt typischerweise durch Vergleich der annotierten Labels mit dem Goldstandard. Gängige Kennzahlen umfassen Accuracy,
Häufige Ursachen von Ungenauigkeit sind unklare oder inkonsistente Richtlinien, mehrdeutige Beispiele, ungenaue oder unvollständige Schulung der
Zur Verbesserung werden klare Annotator-Richtlinien, Schulung und Adjudikation eingesetzt; oft arbeiten mehrere Annotatoren pro Instanz mit