Klusterointiyrityksissä
Klusterointiyrityksissä viittaa prosessiin, jossa pyritään yhdistämään useita erillisiä datan pisteitä tai kohteita ryhmiin eli klustereihin siten, että saman klusterin jäsenet ovat mahdollisimman samanlaisia keskenään ja eri klusterien jäsenet mahdollisimman erilaisia. Tavoitteena on löytää datasta piileviä rakenteita tai malleja. Klusterointia käytetään monilla eri aloilla, kuten datatieteessä, koneoppimisessa, kuvantunnistuksessa ja markkinatutkimuksessa.
Eri klusterointialgoritmeja on olemassa, ja valinta riippuu usein datan luonteesta ja ongelman vaatimuksista. Yleisiä menetelmiä ovat
Klusterointiyrityksissä keskeistä on sopivan etäisyys- tai samankaltaisuusmitan valinta, joka kuvaa kohteiden välistä suhdetta. Lisäksi algoritmin parametrien,