klaszterezést
Klaszterezés a statisztikai, gépi tanulási és adatbányászati területeken használt eljárás, amelynek célja, hogy egy adathalmazt hasonló jellemzőkkel rendelkező csoportokba, vagy klaszterekbe sorolja. A klaszterek belső összetétele szoros, míg a klaszterek közötti különbségek jelentősek legyenek. A módszer elméleti alapjait a gépi tanulás kontextusában a felügyelet nélküli tanulás (unsupervised learning) díszít, mivel a címkézetlen adatokon dolgozik és nem követel előre meghatározott osztályokkal.
A klaszterezés alapíkei közé tartoznak a hyopteszisnek nevezett technikák, mint pl. a densitás alapú módszerek (DBSCAN,
Az értékeléseban is léteznek szigorú metrikák, melyek gyakran a külső (accuracy, purity) vagy a belső (silhouette
Klasszterezés az élő tudományos kutatók és a szervezetek számára kombinálja a világos elméleti alapokat és a