binääluokitteluun - Infinite Lexicon - Infinite Lexicon

binääluokitteluun

Binääluokittelu on valvottu koneoppimisen tehtävä, jossa havaintoja luokitellaan kahteen mahdolliseen luokkaan. Kohdemuuttuja on binäärinen, esimerkiksi 0/1 tai positiivinen/negatiivinen, ja tavoitteena on oppia malli, joka antaa todennäköisyyden kuulumiselle toiseen luokkaan sekä tekee luokkajaon tiettyyn kynnykseen perustuen.

Yleisiä lähestymistapoja ovat logistinen regressio, tukivektorikoneet (SVM), päätöspuut ja niiden ensemble-ryhmät (satunnaismetsät, gradient boosting -menetelmät), sekä

Arviointi mittaa mallin kykyä erottaa luokat sekä antaa luottamusarvioita. Yleisimmät mittarit ovat tarkkuus (accuracy), tarkkuus (precision)

Datan esikäsittely ja oppimisprosessi huomioivat ominaisuuksien standardisoinnin, puuttuvien arvojen käsittelyn ja luokkien tasapainottamisen, jos luokkia on

Sovellusalueet vaihtelevat lääketieteellisestä diagnoosista ja talousanalyysiin sekä sähköpostin suodatukseen ja kuvan- sekä puheentunnistukseen. Binääluokittelu on keskeinen

tulkittavuudesta.

herkkyys/recall,

erottelumielessä

todennäköisyyspaperit

epätasapainossa.

hyperparametrien

yleistettävyys

luotettavuuteen.

riskipäätöksiin.