Tiheysperusteiset
Tiheysperusteiset ovat menetelmiä, joita käytetään tilastollisessa tiedonlouhinnassa ja datan analyysissä. Ne perustuvat datapisteiden paikalliseen tiheyteen ja soveltuvat erityisesti klusterointiin sekä poikkeavuuksien havaitsemiseen. Tiheysperusteisissa menetelmissä klusterit määritellään alueina, joissa pisteitä esiintyy runsaasti suhteessa ympäristöönsä; matalatiheiset alueet erotetaan erilleen.
Periaate: Metodit arvioivat paikallisen tiheyden esimerkiksi laskemalla naapurien määrän tietyllä säteellä tai käyttämällä k-naapureita. Korkean tiheyden
Esimerkkejä: Tunnetuimpia tiheysperusteisia menetelmiä ovat DBSCAN, OPTICS ja HDBSCAN. DBSCAN tarvitsee parametrit epsilon (säde) ja minPts,
Ominaisuudet: Tiheysperusteiset menetelmät voivat löytää epämuodostuneita tai useasta eri tiheydestä koostuvia klustereita sekä ovat usein vähemmän
Käyttökohteet: datamining, GIS, kuvan- ja signaalinkäsittely sekä poikkeavuuksien havaitseminen. Tiheysperusteisia menetelmiä käytetään myös segmentoinnissa ja verkkodatan