Klusterointimallit
Klusterointimallit, suomeksi klusterointimallit, ovat koneoppimisen menetelmiä, joita käytetään ryhmittelemään datajoukon datapisteitä samankaltaisuuden perusteella. Klusterointi on ohjaamatonta oppimista, mikä tarkoittaa, että malli ei tarvitse esiasennettua tietoa tai luokkia. Sen sijaan se löytää rakenteita ja malleja datasta itsenäisesti. Klusterointimallien tavoitteena on luoda klustereita siten, että saman klusterin sisällä olevat datapisteet ovat mahdollisimman samankaltaisia, ja eri klusterien välillä olevat datapisteet mahdollisimman erilaisia.
Yksi tunnetuimmista klusterointimalleista on K-means. K-means-algoritmi pyrkii jakamaan datan K ennalta määriteltyyn määrään klustereita. Se toimii
Muita klusterointimalleja ovat esimerkiksi hierarkkinen klusterointi, joka rakentaa klusterihierarkian, ja DBSCAN (Density-Based Spatial Clustering of Applications