luokitusmenetelmien
Luokitusmenetelmät ovat tilastollisia ja koneoppimisen menetelmiä, joiden tarkoituksena on sijoittaa uudet havainnot ennalta määriteltyihin luokkiin. Ne rakentuvat usein ohjattuun oppimiseen, jossa käytetään merkittyä koulutusdataa. Luokitukset voivat olla binäärisiä (kaksi luokkaa) tai moniluokkaisia, ja ne soveltuvat erilaisiin päätöksenteko- ja ennustetehtäviin.
Yleisimmät menetelmät kattavat sekä perusmenetelmät että kehittyneemmät mallit. Esimerkkejä ovat logistinen regressio, päätöspuut, tukivektorikoneet (SVM), k-nearest
Koulutus ja arviointi tapahtuvat ohjatun oppimisen periaatteiden mukaan: koulutusdata opettaa luokat, ja malli testataan ennusteiden oikeellisuudella.
Käytännön huomioita ovat datan laatu, puuttuvat arvot, ominaisuuksien valmistelu sekä skaalaus ja normalisointi. Ominaisuuksien valinta ja