Klusterointimalleja
Klusterointimalleja, eli klusterointialgoritmeja, käytetään datan segmentointiin ryhmiin, joita kutsutaan klustereiksi. Klusterointi on ohjaamatonta oppimista, mikä tarkoittaa, että dataan ei ole liitetty valmiita luokkia. Tavoitteena on löytää piileviä rakenteita datasta niin, että samankaltaiset datapisteet päätyvät samaan klusteriin ja erilaiset datapisteet eri klustereihin.
Yksi tunnetuimmista klusterointimalleista on K-means. K-means-algoritmissa datan oletetaan jakautuvan K-määrään klustereita. Algoritmi pyrkii minimoimaan etäisyyden datapisteiden
Muita klusterointimalleja ovat esimerkiksi DBSCAN (Density-Based Spatial Clustering of Applications with Noise), joka perustuu pisteiden tiheyteen