luokittelumenetelmät

Luokittelumenetelmät ovat tilastollisia ja koneoppimisen tekniikoita, joiden tavoitteena on liittää jokainen havainto yhteen ennalta määritellystä luokasta. Ne kuuluvat ohjattuun oppimiseen, jossa malli oppii yhteyden ominaisuuksien (X) ja luokan (Y) välillä koulutusdatoista. Tyypillinen työprosessi sisältää aineiston esikäsittelyn, ominaisuuksien valinnan tai muokkauksen, mallin koulutuksen, tulosten arvioinnin ja käyttöönoton sovelluksessa.

Yleisimmät luokittelumenetelmät ovat logistinen regressio, diskrimanttianalyysi (LDA ja QDA), päätöspuut, satunnaismetsät sekä gradient boosting -menetelmät, tukivektorikoneet

Arviointi ja soveltaminen: Luokittelumenetelmien suoritus mitataan usein mittareilla kuten tarkkuus, herkkyys (recall), F1-arvo ja ROC-AUC. Oikean

monimutkaisempia,

luokittelutehtäviä.

ominaisuuksista,

hyperparametrien

laskentaresursseista

Käytännössä

ristikkäisvalidaatiolla.

Luokittelumenetelmät

lääketieteeseen,

kuvanluokitteluun

riskinarviointiin.