Clusterqualität
Clusterqualität bezeichnet die Güte der Ergebnisse eines Clustering-Verfahrens und gibt Aufschluss darüber, wie gut Objekte innerhalb eines Clusters einander ähneln und wie deutlich verschiedene Cluster voneinander abgegrenzt sind. Sie ist kontextabhängig und hängt von der Zielsetzung, dem Datensatz, der gewählten Distanz- und Gewichtungsmethode sowie vom gewählten Clustering-Algorithmus ab.
Zur Bewertung der Clusterqualität werden interne, externe und Stabilitätskennzahlen unterschieden. Interne Kennzahlen beurteilen die Struktur der
Wichtige Einflussfaktoren sind die Wahl des Distanzmaßes, die Skalierung der Merkmale, die Anzahl der Cluster und
---