Szófeldolgozás
Szófeldolgozás a természetes nyelvű szövegek számítógépes elemzésének olyan területe, amely a szavak szintű feldolgozására összpontosít. Gyakran a teljes szövegfeldolgozás részeként tekintik, de közvetlenül a szavakhoz kapcsolódó feladatokra koncentrál. Célja a nyelvi információk hatékony kiszűrése, értelmezése és felhasználása különböző alkalmazásokban.
Jellemző feladatok közé tartozik a tokenizáció (szavakra bontás), a normalizáció (például kisbetűre alakítás, diakritikus jelek kezelése),
Az alkalmazási területek közé tartozik a keresőmotorok indexelése és keresése, szöveges adatbányászat, helyesírás- és nyelvtan-ellenőrzés, gépi
Kihívások közé sorolható a magyar nyelv összetett morfológiája, a szóalakok sokfélesége, kontextuális disambiguáció és az adatok