klusterdamise
Klusterdamine on andmete grupeerimise meetod, mille käigus jaotatakse andmekogum omavahel sarnaste omadustega näidete gruppidesse ehk klastritesse. Eesmärk on avastada andmete sisemine struktuur ning teha nähtavaks mustrid ilma juhiste märgistusteta või labeliteta.
Peamised lähenemisviisid erinevad selle järgi, kuidas mõõdetakse sarnasust ja milline klastrite kuju on oodatud. Keskse jaotuse
Protsess hõlmab andmete eeltöötlust (skaalumine, puuduvate väärtuste täitmine), sobiva kaugusmõõdu või sarnasuse metrika valimist ning algoritmi
Rakendused hõlmavad klientide segmenteerimist turunduses, pildisegmenteerimist, bioinformaatikat ja anomaalia avastamist. Klusterdamine aitab andmeid mõista, tuua esile
Piirangud: tulemused sõltuvad valitud algoritmist, parameetritest ja andmete skaalast; kõrge dimensioonilisus ning ebaühtlased klastrite suurused võivad
---