clusteringgebaseerde
Clusteringgebaseerde verwijst naar methoden en analyses die clustering gebruiken om patronen en structuren in data te ontdekken zonder vooraf gedefinieerde labels. Bij clustering worden objecten gegroepeerd op basis van gelijkenissen volgens een gekozen afstands- of vergelijkingsmaat, zodat leden van hetzelfde cluster vergelijkbaar zijn en objecten uit verschillende clusters verschillend. Veelgebruikte algoritmen zijn partitioneel (bijv. k-means, k-medoids), hiërarchisch, dichtheidsgebaseerd (DBSCAN, OPTICS) en modelgebaseerd (Gaussian mixture models).
Het proces omvat doorgaans gegevensvoorbereiding en normalisatie, selectie van kenmerken en een passende afstandsmaat. Het bepalen
Voordelen zijn onder meer dat er geen labels nodig zijn en dat onbekende structuren kunnen worden onthuld;