klusterointialgoritmeja
Klusterointialgoritmit ovat joukko algoritmeja, joita käytetään datan segmentointiin pienempiin ryhmiin eli klustereihin. Tavoitteena on, että saman klusterin datapisteet ovat mahdollisimman samankaltaisia keskenään ja mahdollisimman erilaisia muiden klustereiden datapisteisiin nähden. Klusterointi on ohjatonta oppimista, mikä tarkoittaa, että algoritmi ei tarvitse ennalta määriteltyjä luokkia tai tunnisteita datalle.
Yksi tunnetuimmista klusterointialgoritmeista on K-means. Se pyrkii jakamaan datan K ennalta määriteltyyn määrään klustereita. Algoritmi toimii
Muita klusterointialgoritmeja ovat esimerkiksi DBSCAN (Density-Based Spatial Clustering of Applications with Noise), joka perustuu tiheyseroihin datassa,