Randindeksit
Randindeksit ovat mittareita, joita käytetään kahden datajoukon klusteroinnin tulosten vertailuun. Ne arvioivat, kuinka paljon kaksi jakaumaa ovat samaa mieltä kaikista alkioiden pareista: mitkä parit ovat samassa klusterissa molemmissa jakaumissa ja mitkä parit ovat eri klustereissa.
Oletetaan, että on n alkiota ja kaksi jakaumaa A ja B. a = parien määrä, jotka ovat samassa
Rand-indeksin suurin ongelma on, ettei sitä oikaista sattumanvaraisuutta vastaan. Siksi käytetään usein sen muunnosta, Adjusted Rand
Käyttö ja rajoitteet: Randindeksi on helppo laskea ja tulkita, ja sitä käytetään yleisesti klusterointitulosten arvioinnissa todellisen