ClusteringAlgorithmen
ClusteringAlgorithmen bezeichnen eine Klasse von Verfahren der unüberwachten Mustererkennung, die Datensätze in Gruppen (Cluster) aufteilen, wobei Objekte innerhalb eines Clusters einander ähnlich und Objekte in unterschiedlichen Clustern unähnlich sind. Ziel ist es, Strukturen in den Daten zu identifizieren, ohne auf vorab definierte Labels angewiesen zu sein.
Zu den wichtigsten Kategorien gehören partitionierende Algorithmen wie K-Means und K-Medoids, die den Datensatz in k
Gitterbasierte oder rasterbasierte Ansätze quantisieren den Raum in Gitterzellen und eignen sich gut für sehr große
Wichtige Aspekte der Praxis umfassen die Wahl von Distanz- oder Ähnlichkeitsmaßen, Datenvorverarbeitung wie Skalierung und Umgang