Kategorieanzahl
Kategorieanzahl bezeichnet die Anzahl der verschiedenen Kategorien, die verwendet werden, um Objekte, Dokumente oder Datenpunkte zu kennzeichnen. Sie gibt die Größe des Labelraums an und beeinflusst Granularität, Lernleistung und Verwaltungsaufwand in Systemen zur Klassifikation oder Taxonomie.
Typische Anwendungsbereiche sind maschinelles Lernen und Data Annotation (Bild-, Text- oder Produktklassifikation), Content-Management-Systeme, Katalog- und Taxonomie-Design
Auswirkungen: Zu wenige Kategorien liefern unpräzise Labels und begrenzen Aussagefähigkeit; zu viele Kategorien erhöhen das Risiko
Bestimmung: Beginnen mit einer Domänenanalyse und einer ersten Datenerhebung, gefolgt von Pilotannotationen. Analysieren Sie die Verteilung
Pflege und Governance: Kategoriepläne sollten versioniert, dokumentiert und regelmäßig überprüft werden, um Kategorieverdrehungen, Drift oder Subsumption
Verwandte Begriffe: Taxonomie, Ontologie, Labelraum, Granularität, Hierarchie vs. Flachstruktur.