luokittelumenetelmät
Luokittelumenetelmät ovat tilastollisia ja koneoppimisen tekniikoita, joiden tavoitteena on liittää jokainen havainto yhteen ennalta määritellystä luokasta. Ne kuuluvat ohjattuun oppimiseen, jossa malli oppii yhteyden ominaisuuksien (X) ja luokan (Y) välillä koulutusdatoista. Tyypillinen työprosessi sisältää aineiston esikäsittelyn, ominaisuuksien valinnan tai muokkauksen, mallin koulutuksen, tulosten arvioinnin ja käyttöönoton sovelluksessa.
Yleisimmät luokittelumenetelmät ovat logistinen regressio, diskrimanttianalyysi (LDA ja QDA), päätöspuut, satunnaismetsät sekä gradient boosting -menetelmät, tukivektorikoneet
Arviointi ja soveltaminen: Luokittelumenetelmien suoritus mitataan usein mittareilla kuten tarkkuus, herkkyys (recall), F1-arvo ja ROC-AUC. Oikean