binaarklassifikatsiooni
Binaarklassifikatsioon on masinõppe ja statistika ülesanne, kus iga sisendi kohta tuleb määrata üks kahest võimalikust klassist. Tavaliselt on andmestik koos märgiga y ∈ {0,1} ja omadused x. Mudel võib anda otsese klassi või tõenäosuse p(y=1|x).
Levinud lähenemised hõlmavad logistilist regressiooni, tugivektori masinaid, otsustuspuud, juhuslikke metsi, gradient boostingut ja sügavaid närvivõrke. Enamasti
Kui mudel väljundina annab tõenäosuse, saab klassi määrata sobiva künnisega. Künnise valik sõltub rakendusest ja soovitud
Mõõdikud hõlmavad täpsust (accuracy), tundlikkust (recall) ja spetsifilisust (specificity), F1-skoori ning ROC-AUC-i. Ebavõrdsus andmestikus, andmete lekkimine
Rakendused hõlmavad e-posti rämpsposti eristamist, meditsiinilist diagnoosi, finantspettuste avastamist ning kvaliteedikontrolli või pildituvastust.