klusterkvalitet
Klusterkvalitet er et begrep innen klusteranalyse som beskriver hvor godt en inndeling av data i kluster gjenspeiler underliggende mønstre. En kvalitetsrik klustring kjennetegnes av høy innvendig homogenitet—punkter i samme kluster ligner hverandre—og god separasjon mellom kluster, slik at ulike kluster er tydelig ulike fra hverandre. Kvaliteten avhenger av formål og valgt målemetodikk, og det finnes ingen universell standard som passer alle data.
Vurdering av klusterkvalitet kan være intern eller ekstern. Interne mål vurderer strukturen basert på selve dataene,
Faktorer som påvirker klusterkvaliteten inkluderer valg av algoritme (for eksempel k-means, hierarkisk klustring, DBSCAN, eller spektral
Bruksområder spenner fra markedssegmentering og bildediagnostikk til biologiske datasett i genomikk. For å forbedre klusterkvaliteten bør