Ryhmittelykaavioya
Ryhmittelykaavio (yleisin kirjoitusmuoto ryhmittelykaavio; termi 'Ryhmittelykaavioya' esiintyy harvoin ja on virheellinen) on diagrammi, jolla esitellään kohteiden ryhmittely luokkiin tai klustereihin niiden samankaltaisuuksien tai etäisyyksien perusteella. Kaavio auttaa havainnollistamaan datan rakenteita ja tunnistamaan luonnolliset ryhmät.
Ryhmittelykaavion rakentaminen perustuu klusterointiin. Yleisimpiä muotoja ovat hierarkkinen ryhmittely, joka tuottaa dendrogrammin, puumaisen diagrammin, jossa haarojen
Käytännössä kaavio rakennetaan valitsemalla ominaisuudet ja niiden normalisointi, etäisyysmittari (esim. Euclidinen etäisyys tai korrelaatio) sekä ryhmittelyalgoritmi.
Tulkitessa kannattaa kiinnittää huomiota klusterien määrään, joka voidaan arvioida dendrogrammista tai käyttämällä mittareita kuten silhouette-arvo. Rajoitteina
Käyttöalueet kattavat biologisen luokittelun, markkinatutkimuksen, sosiaaliset tieteet sekä tekstien ja kuvien kaltaisen monimutkaisen datan analyysin.