ryhmittelyanalyysia
Ryhmittelyanalyysi, eli klusterianalyysi, on tilastollinen menetelmä, jonka avulla dataa voidaan jakaa samankaltaisiin ryhmiin. Tavoitteena on löytää luonnollisia ryhmittymiä eli klustereita datajoukon sisällä siten, että saman klusterin jäsenet ovat mahdollisimman samankaltaisia ja eri klusterien jäsenet mahdollisimman erilaisia. Ryhmittelyanalyysi on usein etsivää eli exploratiivista datan analyysia, eikä se edellytä ennalta määriteltyjä luokkia.
Menetelmää käytetään monilla eri aloilla. Esimerkiksi markkinoinnissa ryhmittelyanalyysia voidaan hyödyntää asiakassegmentoinnissa, jotta voidaan tunnistaa erilaisia asiakasryhmiä
Ryhmittelyanalyysiin on olemassa useita erilaisia algoritmeja ja lähestymistapoja. Yleisiä menetelmiä ovat hierarkkinen klusterointi, joka rakentaa puurakenteen