Klusterointimetodit
Klusterointimetodit ovat koneoppimisen tekniikoita, joita käytetään datan ryhmittelyyn samankaltaisten kohteiden perusteella. Tavoitteena on löytää datasta luonnollisia ryhmiä eli klustereita siten, että saman klusterin kohteet ovat mahdollisimman samanlaisia keskenään ja eri klustereiden kohteet mahdollisimman erilaisia. Klusterointia voidaan käyttää monenlaisissa sovelluksissa, kuten asiakassegmentoinnissa, kuvantunnistuksessa ja poikkeamien havaitsemisessa.
Yksi yleisimmistä klusterointimenetelmistä on K-means-algoritmi. K-means pyrkii jakamaan datan K ennalta määrättyyn määrään klustereita. Algoritmi alkaa
Toinen suosittu menetelmä on hierarkkinen klusterointi. Tämä lähestymistapa rakentaa klusterihierarkian joko yhdistämällä pienempiä klustereita suuremmiksi (aggregaatiivinen)
Muita klusterointimenetelmiä ovat esimerkiksi DBSCAN (Density-Based Spatial Clustering of Applications with Noise), joka perustuu tiheyseroihin, ja