gruuppimine
Gruupimine on protsess, mille käigus organiseeritakse objektid või andmepunktid rühmadesse nende ühiste omaduste või kriteeriumide alusel. See võib toimuda käsitsi või automatiseeritud meetoditega ning aitab keerulist infot selgemaks muuta ja analüüsi jaoks struktureerida.
Grupeerimine võib olla hierarhiline või tasandiline ning hõlmab nii käsitsi määratletud kategooriaid kui ka andmepõhist klasterdamist.
Levinumad tehnikad hõlmavad klasterdamist (nt k-means, hierarhiline klasterdamine, DBSCAN) ja andmebaaside operatsioone nagu SQL GROUP BY
Rakendusalad hõlmavad kliendi-segmenteerimist turu-uuringutes, dokumentide või piltide grupeerimist ning bioinformaatikas geenide ekspressiooni rühmitamist.
Väljakutsed hõlmavad sobivate kriteeriumide valimist, rühmade arvu määramist, müra ja ebaregulaarsuste mõju ning tulemuste tõlgendatavuse ning
Seotud mõisted on andmete klasterdamine, kategoriseerimine ja andmete kokkuvõttev statistika ning SQL GROUP BY.