Binääriluokittelumalleilla
Binääriluokittelumallit ovat koneoppimisen malleja, jotka pyrkivät ennustamaan kahdesta mahdollisesta luokasta toista. Tämä tarkoittaa, että mallin tuottama tulos on aina joko yksi tai nolla, kyllä tai ei, tosi tai epätosi, tai muu vastaava binäärinen arvo. Esimerkkejä binääriluokitteluongelmista ovat sähköpostien roskapostiksi luokittelu, luottokelpoisuuden arviointi (luottokelpoinen/ei luottokelpoinen) tai sairauden diagnosointi (sairas/terve).
Binääriluokittelumalleja on useita erilaisia. Yksi yleisimmistä on logistinen regressio, joka käyttää logistista funktiota mallintamaan todennäköisyyttä sille,
Malliin syötetään yleensä joukko ominaisuuksia, joiden perusteella se tekee ennusteen. Esimerkiksi sähköpostin roskapostiksi luokittelussa ominaisuuksia voisivat
Binääriluokittelumallien arviointiin käytetään useita metriikoita, kuten tarkkuutta (accuracy), herkkyyttä (recall), tarkkuutta (precision) ja F1-pisteytystä. Näiden metriikoiden