ClusteringMaßen
ClusteringMaßen bezeichnet eine Gruppe von Kennzahlen, die die Qualität einer Clustering-Ergebnisgruppierung bewerten. Sie helfen dabei zu verstehen, wie gut die Daten durch eine Aufteilung in Cluster beschrieben werden, und unterstützen Methodenwahl, Parameterabstimmung sowie den Modellvergleich in der Datenanalyse.
Interne Maße bewerten die Qualität ausschließlich anhand der Daten und der Cluster-Struktur, ohne Bezug zu einer
Externe Maße vergleichen die gefundene Clustering-Struktur mit einer bekannten Ground Truth oder externen Labels. Zu den
Weiterhin spielen Faktoren wie Wahl des Abstandsmaßes, Normalisierung der Merkmale, Dimensionalität und Datenverteilung eine Rolle. ClusteringMaßen
Anwendungen liegen in der Auswahl des geeigneten Algorithmus, der Bestimmung der Clusterzahl, der Stabilitätsanalyse und dem