klusterointialgoritmeista
Klusterointialgoritmit ovat koneoppimisen menetelmiä, joita käytetään datan ryhmittelyyn samankaltaisten kohteiden perusteella. Tavoitteena on löytää datasta luonnollisia ryhmiä eli klustereita siten, että saman klusterin sisällä olevat datapisteet ovat mahdollisimman samankaltaisia ja eri klusterien pisteet mahdollisimman erilaisia. Algoritmit eivät yleensä vaadi ennalta määriteltyjä luokkia, vaan ne löytävät rakenteen automaattisesti datasta.
Yksi yleisimmistä klusterointialgoritmeista on K-Means. Se jakaa datapisteet K ennalta määriteltyyn määrään klustereita. Algoritmi toimii iteratiivisesti
Toinen merkittävä algoritmi on hierarkkinen klusterointi. Se muodostaa klusterihierarkian, joko yhdistämällä pienempiä klustereita suuremmiksi (agglomeratiivinen) tai
Muita klusterointiin käytettäviä algoritmeja ovat muun muassa DBSCAN (Density-Based Spatial Clustering of Applications with Noise), joka