roskapostiluokittelu
Roskapostiluokittelu tarkoittaa prosessia, jossa viestit luokitellaan roskapostiksi tai ei-roskapostiksi. Yleisesti se liittyy sähköpostiin, mutta se kattaa myös pikaviestimet, verkkopalveluiden kommenttiketjut ja sosiaalisen median viestit. Tavoitteena on suojata käyttäjiä ei-toivotulta viestiltä sekä parantaa viestinnän relevanssia ja tietoturvaa.
Menetelmät: Perinteiset sääntöihin perustuvat suodattimet perustuvat roskapostikieltoihin, sallittujen sanojen luetteloihin sekä sanojen esiintymisen analyysiin. Edistyneemmät järjestelmät
Arviointi: Suodattimien laadukkuutta mitataan usein tarkkuudella (precision), palautuksella (recall) ja F1-asteikolla sekä ROC-AUC-arvolla. Datan laatu, luokkatasapainotus
Käyttökohteet ja haasteet: Sähköpostin roskapostisuodattimet, kommenttien moderointi ja chat-sovellusten viestien suojaaminen ovat yleisiä sovelluksia. Haasteisiin kuuluvat