klusterointitehtävissä
Klusterointitehtävissä viitataan tehtäviin, joissa data jaetaan ryhmiin eli klustereihin. Klusterointi on ohjaamatonta oppimista, mikä tarkoittaa, että algoritmi pyrkii löytämään datasta rakenteita ilman ennalta määriteltyjä luokkia. Tavoitteena on ryhmitellä samankaltaisia datapisteitä yhteen ja erottaa ne eri ryhmistä olevista datapisteistä. Samankaltaisuutta mitataan yleensä etäisyysmittareilla, kuten euklidisella etäisyydellä tai kosini-samankaltaisuudella.
Klusterointitehtäviä käytetään monilla eri aloilla. Esimerkiksi markkinointi voi käyttää klusterointia asiakkaiden segmentointiin heidän ostokäyttäytymisensä perusteella. Biologiassa
On olemassa useita erilaisia klusterointialgoritmeja, joista yleisimpiä ovat K-means, hierarkkinen klusterointi ja DBSCAN. K-means pyrkii jakamaan