klasteranalüüs
Klasteranalüüs on andmestiku uurimise meetod, mille eesmärk on grupeerida andmepunktid klastriteks nii, et iga klaster sisaldab üksteisega sarnaseid üksusi ning klastrite vahelised erinevused on märkimisväärsed. See on peamiselt juhendamatu õpe, kus teadaolevaid märgendusi ei kasutata; klastrid antakse andmete sisust omavahel kaasa.
Klasterduses eristatakse hard clustering, kus iga üksus kuulub ühte klastrisse kindlalt, ja soft clustering, kus üksus
Ettevalmistus hõlmab andmete standardiseerimist või normaliseerimist, sest paljud algoritmid on tundlikud skaleerimisele. Levinud kaugusmõõdud on eukleidiline
Rakendused on laialdased: kliendisegmentatsioon turunduses, biomeditsiini ja genomika analüüs, ökoloogia, pilditöötlus ja sotsiaalteaduste uuringud. Kvaliteedi hindamiseks