binääluokitteluun
Binääluokittelu on valvottu koneoppimisen tehtävä, jossa havaintoja luokitellaan kahteen mahdolliseen luokkaan. Kohdemuuttuja on binäärinen, esimerkiksi 0/1 tai positiivinen/negatiivinen, ja tavoitteena on oppia malli, joka antaa todennäköisyyden kuulumiselle toiseen luokkaan sekä tekee luokkajaon tiettyyn kynnykseen perustuen.
Yleisiä lähestymistapoja ovat logistinen regressio, tukivektorikoneet (SVM), päätöspuut ja niiden ensemble-ryhmät (satunnaismetsät, gradient boosting -menetelmät), sekä
Arviointi mittaa mallin kykyä erottaa luokat sekä antaa luottamusarvioita. Yleisimmät mittarit ovat tarkkuus (accuracy), tarkkuus (precision)
Datan esikäsittely ja oppimisprosessi huomioivat ominaisuuksien standardisoinnin, puuttuvien arvojen käsittelyn ja luokkien tasapainottamisen, jos luokkia on
Sovellusalueet vaihtelevat lääketieteellisestä diagnoosista ja talousanalyysiin sekä sähköpostin suodatukseen ja kuvan- sekä puheentunnistukseen. Binääluokittelu on keskeinen