Binääriluokitus
Binääriluokitus on koneoppimisen tehtävä, jossa kohteita tai havaintoja jaetaan kahteen eri luokkaan. Tyypillisiä esimerkkejä binääriluokittelusta ovat roskapostin tunnistaminen (roskaposti tai ei roskapostia), sairauden diagnosointi (sairas tai terve) tai luottokelpoisuuden arviointi (hyväksytty tai hylätty). Tavoitteena on kehittää malli, joka pystyy ennustamaan uuden, tuntemattoman havainnon luokan perustuen aiemmin opittuihin tietoihin.
Binääriluokittelumallit voivat perustua erilaisiin algoritmeihin, kuten logistiseen regressioon, tukivektorikoneisiin (SVM), päätöspuihin tai neuroverkkoihin. Mallin koulutusprosessi sisältää
Luokittelumallin suorituskykyä arvioidaan usein erilaisilla mittareilla, kuten tarkkuudella (accuracy), herkkyydellä (recall), spesifisyydellä (precision) ja F1-pisteellä. Näiden