klusterianalyysiin
Klusterianalyysi, tunnetaan myös nimellä ryvästys tai klusterointi, on joukko menetelmiä, joita käytetään tilastotieteessä ja koneoppimisessa datapisteiden ryhmittelemiseen siten, että saman ryhmän eli klusterin pisteet ovat samankaltaisempia keskenään kuin eri ryhmiin kuuluvien pisteiden. Tavoitteena on löytää datasta piileviä rakenteita ja tunnistaa luonnollisia ryhmittymiä ilman ennalta määritettyjä luokkia. Klusterianalyysi on siis ohjaamatonta oppimista, koska se ei vaadi merkittyä dataa.
Klusterointimenetelmiä on useita erilaisia, ja ne eroavat toisistaan siinä, miten ne määrittelevät samankaltaisuuden ja miten ne
Klusterianalyysin sovellusalueet ovat laajat. Sitä käytetään esimerkiksi asiakassegmentoinnissa markkinoinnissa, kuvien tunnistuksessa ja segmentoinnissa, biologisessa datan analysoinnissa