ryhmittelyanalyysit
Ryhmittelyanalyysit ovat tilastollisia ja datatieteellisiä menetelmiä, joiden tarkoituksena on jakaa havaintojoukko ryhmiin siten, että saman ryhmän jäsenet ovat toisiaan läheisiä ja eri ryhmiin kuuluvat havainnot eroavat toisistaan. Näissä analyyseissä ei edellytetä etukäteen määriteltyjä luokkia, vaan rakenteet löytyvät datasta itsestään.
Yleisimmät lähestymistavat ovat hierarkkinen ryhmittely, k-means ja tiheydestä riippuvat menetelmät kuten DBSCAN sekä tilastolliset mallit kuten
Menetelmien valinta ja tulkinta riippuvat sekä datan ominaispiirteistä (skaalaus, mitta-asteikot) että tavoitteista. Tyypillisiä haasteita ovat optimaalisen