dichtheidsgebaseerde
Dichtheidsgebaseerde methoden zijn benaderingen in gegevensanalyse die clustervorming en uitbijterdetectie mogelijk maken op basis van de lokale dichtheid van punten. In plaats van uitgaan van globale afstanden of vooronderstellingen over de vorm van clusters, gebruiken ze de dichtheid rondom punten om te bepalen of ze bij elkaar horen.
Belangrijke begrippen zijn onder meer een buurtradius epsilon en een minimumaantal punten minPts. Een kernpunt is
De bekendste methode is DBSCAN (Density-Based Spatial Clustering of Applications with Noise). Het algoritme selecteert twee
Naast DBSCAN bestaan er verbeteringen zoals OPTICS en HDBSCAN. OPTICS produceert geen vaste epsilon en geeft
Toepassingen omvatten geografische informatiesystemen, beeldsegmentatie, anomaliedetectie en marktanalyse. Nadelen zijn gevoeligheid voor parameterkeuze, minder presteert bij