klassifitseerimistöid
Klassifitseerimistöid on masinõppe valdkonna keskne ülesanne, kus iga sisendi omaduste kogumi põhjal määratakse sellele sobiv klass. Tavaline ülesanne kasutab märgistatud andmestikku, kus iga näide koosneb omadustest ja selle kuuluvast klassist. Probleem võib olla binaarne (kaks klassi), mitmikklassifikatsioon (mitme klassi vahel valimine) või multilabel-konstruktsioon, kus sama näide võib kuuluda mitmele klassile samaaegselt.
Kõige levinumad meetodid hõlmavad logistilist regressiooni, Naive Bayes'i, k- lähima naabri meetodit (k-NN), otsustuspuud, juhuslikku metsa
Andmestiku ettevalmistamine hõlmab märgenduse kontrolli, kategorialsete muutujate kodeerimist (nt one-hot kodeerimine), standardiseerimist või funktsioonide skaleerimist ning
Hindamine toimub tavaliselt holdout- või kross-valideerimisega; toimivust hinnatakse näiteks täpsuse, F1-skoori ja ROC AUC-i abil ning
Rakendused hõlmavad teksti ja piltide sildistamist, meditsiinilisi diagnoose, finants- ja turvariski hindamist ning erinevaid soovitus- ja