klusteripohjaisista
Klusteripohjaiset lähestymistavat kuvaavat analyyttisiä menetelmiä, joissa havaintoja ryhmitellään klustereihin ominaisuuksiensa samankaltaisuuden perusteella. Tavoitteena on löytää piileviä rakenteita suurista datajoukoista sekä helpottaa tulkintaa, ennustamista ja päätöksentekoa. Termi viittaa siihen, että ryhmittelyn perusta on tilastollinen tai algoritminen klusterointi eikä ennalta määrätty luokitus.
Menetelmät voivat olla esimerkiksi k-means-tyylisiä klusterointeja, hierarkkista klusterointia sekä tiheysperusteisia menetelmiä kuten DBSCAN ja OPTICS, sekä
Sovelluksia esiintyy monilla aloilla: bioinformatiikassa geenien ilmentymisdata voidaan ryhmittää samankaltaisten ilmentymiskuvioiden perusteella; markkinoinnissa asiakkaat voidaan segmentoida
Haasteisiin kuuluu oikean etäisyysfunktionsa valitseminen, datan normalisointi ja skaalaus sekä klusterimäärän määrittäminen. Tulosten tulkinta vaatii usein