ryhmittelymenetelmiä
Ryhmittelymenetelmät, tunnettu myös nimellä klusterointi, ovat koneoppimisen ja tilastotieteen menetelmiä, joiden tavoitteena on jakaa joukko havaintoja luonnollisiin ryhmiin eli klustereihin. Klusterin jäsenet ovat tyypillisesti samankaltaisia keskenään, kun taas eri klustereiden jäsenet ovat erilaisia. Ryhmittelymenetelmät ovat tyypillisesti valvomattomia oppimismenetelmiä, eli ne eivät vaadi ennalta määriteltyjä luokkia tai merkintöjä.
Yleisimpiä ryhmittelymenetelmiä ovat k-means, hierarkkinen klusterointi ja DBSCAN. K-means pyrkii jakamaan datan ennalta määriteltyyn k lukumäärään
Ryhmittelymenetelmiä käytetään laajalti eri aloilla. Esimerkiksi markkinatutkimuksessa niitä voidaan käyttää asiakkaiden segmentointiin. Biologiassa niitä voidaan soveltaa