ClusterMethoden
ClusterMethoden bezeichnen in der Statistik und dem Data Mining Verfahren zur Gruppierung von Objekten in Cluster, so dass Objekte innerhalb desselben Clusters einander ähnlicher sind als Objekte in unterschiedlichen Clustern. Da Clustering in der Regel unüberwacht erfolgt, erfolgt die Bildung der Gruppen ohne vorab definierte Labels.
Zu den bekanntesten Typen gehören partitionierende Methoden wie k-Means und k-Medoids; hierarchische Ansätze (agglomerativ, divisiv); dichtebasierte
Der typische Prozess umfasst: Datenvorverarbeitung und Skalierung, Wahl eines Abstands- oder Ähnlichkeitsmaßes, Auswahl der Methode und
Anwendungen finden sich in Kundensegmentierung, Markt- und Mustererkennung, Genomik, Text- bzw. Bildclustering. Grenzen umfassen die Abhängigkeit
Die Bewertung der Clusterqualität erfolgt häufig anhand intern orientierter Indizes (z. B. Silhouette, Davies-Bouldin) oder externen