szövegkategorizálás
Szövegkategorizálás, más néven szövegosztályozás, egy természetesnyelv-feldolgozási feladat, amelynek célja, hogy azonosítsa és hozzárendelje egy adott szöveges dokumentumot egy vagy több előre definiált kategóriához. Ez a folyamat gépi tanulási algoritmusokat használ, amelyek előzetesen kiképzett adatkészleteken tanulnak meg mintázatokat felismerni a szövegekben, amelyek alapján a kategóriákat meghatározzák.
A szövegkategorizálás számos területen alkalmazható. A tartalommoderációban például segíthet felismerni a nem kívánt vagy sértő tartalmakat.
A szövegkategorizálás folyamata általában több lépésből áll. Először megtisztítják és előkészítik a szöveget, eltávolítva a felesleges