luokittelutapoja
Luokittelutapa on menetelmä, jolla esineet, havainnot tai tiedot sijoitetaan ennalta määriteltyihin luokkiin tai kategorioihin. Luokittelua käytetään monilla tieteenaloilla, kuten tietojenkäsittelyssä, biotieteissä ja kielitieteissä. Luokittelutapoja voidaan luokitella useisiin ryhmiin sen mukaan, miten opetus tapahtuu ja millaisia tuloksia haetaan: valvottu luokittelu käyttää ennakkoon merkittyä opetusaineistoa luokkien määrittämiseen, kun taas epävalvottu luokittelu etsii rakenteita ja ryhmiä datasta ilman etukäteen määriteltyjä luokkia. Semi-valvottu oppiminen yhdistää näitä lähestymistapoja.
Valvotussa luokittelussa opetusaineistossa on sekä ominaisuudet että luokat, ja malli oppii näiden välisten yhteyksien perusteella. Tyypillisiä
Epävalvotussa luokittelussa puolestaan pyritään löytämään datasta rakenteita ilman etukäteen määriteltyjä luokkia. Yleisimmät menetelmät ovat klusterointi, kuten
Käytännön valinnat riippuvat datan ominaisuuksista, kuten numeristen ja kategoristen arvojen määrä, tekstin tai kuvien olemassaolo sekä