clusteringbasierten
Clusteringbasierte Ansätze bezeichnen Verfahren des unüberwachten Lernens, die darauf abzielen, Objekte anhand ähnlicher Merkmale in Gruppen zu gliedern, ohne vordefinierte Klassen. Das zentrale Motiv ist die Entdeckung struktureller Muster in den Daten, wobei Ähnlichkeiten meist durch Distanzmaße oder Wahrscheinlichkeitsmodelle definiert werden.
Zu den gängigen Algorithmen gehören k-Means und seine Varianten, hierarchische Clustering-Verfahren (z. B. agglomeratives Clustering), dichtebasierte
Der typische Ablauf umfasst Datenvorverarbeitung, Merkmalsextraktion, Wahl eines Distanz- bzw. Ähnlichkeitsmaßes, Auswahl des Clustering-Verfahrens, Bestimmung der
Anwendungsgebiete umfassen Marktsegmentierung, Bild- und Textsegmentierung, Mustererkennung, Anomalieerkennung, Bioinformatik und Dokumentenorganisation. Clustering basierte Ansätze können als
Vorteile liegen in der Unabhängigkeit von Beschriftung und der Fähigkeit, versteckte Strukturen zu enthüllen. Nachteile sind