klassifiointiin
Klassifiointi on prosessi, jossa kohteet tai ilmiöt jaetaan ennalta määriteltyihin luokkiin. Tämä järjestely helpottaa tiedon hallintaa, analysointia ja päätöksentekoa. Klassifiointiin liittyy usein kysymyksiä luokkien määrittelystä sekä siitä, miten kohteet voidaan erottaa.
Historian saatossa luokittelua on sovellettu monille aloille: biologian lajittelusta ja systematiikasta kirjastojen ja arkistojen luokituksiin sekä
Prosessi sisältää ongelman määrittelyn, datan keräämisen ja esikäsittelyn, ominaisuuksien valinnan, mallin kouluttamisen sekä arvioinnin ja käyttöönoton.
Luokkia erotellaan useilla tavoilla: binääriluokittelu (kaksi luokkaa), moniluokkaluokittelu (useita luokkia) sekä monilabel-klassifiointi (kohteelle voi kuulua useita
Arviointi tapahtuu mittareilla kuten tarkkuus (accuracy), herkkyys (recall) ja F1-pisteet sekä ROC-AUC. Nämä mittarit auttavat ymmärtämään,
Käytännön sovelluksia ovat esimerkiksi kuvan- ja tekstin luokitus, sähköpostin roskapostisuodatus, lääketieteelliset diagnoosit sekä hakukoneiden ja suodatusjärjestelmien