luokittelutavat
Luokittelutavat ovat menetelmiä, joita käytetään kohteiden jaottamiseen ennalta määriteltyihin luokkiin ominaisuuksien perusteella. Niiden tavoitteena on tiivistää ja järjestää tieto sekä tukea hakua, analyysiä ja päätöksentekoa.
Luokittelumenetelmät voidaan jakaa pääosin valvottuihin (supervised), ohjaamattomiin (unsupervised) ja puolivalvottuihin (semi-supervised) menetelmiin. Valvotussa luokittelussa koulutusdata sisältää
Klusterointi itsessään on usein ohjaamatonta, mutta voi toimia preprosessointina ennen varsinaista luokitusta.
Käyttökohteita ovat kirjasto- ja tiedonhallintajärjestelmät, sähköinen kaupankäynti, sähköposti- ja dokumenttien luokittelu, lääketiede sekä kuvien ja äänien
Luokittelumenetelmien valintaan vaikuttavat datan määrä ja laatu, vaadittu tulkittavuus, nopeus, skaalautuvuus sekä mahdolliset eettiset ja yksityisyyskysymykset.
Luokittelutavat kehittyvät datalähtöisen analytiikan ja tekoälyn kehityksen mukana, tarjoten keinoja organisoida monimutkainen data tehokkaasti mutta vaativat