szövegkorpusok
Szövegkorpusok, vagyis szövegek nagy, strukturált gyűjteményei, alapvető eszközei az NLP és a nyelvészet kutatásának. A korpus log (korpusz) szavakból és karakterekből kunok digitális formában tárolt, nyelvtani, morfológiai és szintaktikai elemzési célokra is felhasználható.
Különböző típusba sorolható: monolingual (egyszónyelvű) és multilingual (többnyelvű) korpusok, valamint a szóköztes szövegből (text-based) és a
A szövegkorpusok alkalmazási területei közé tartozik a gépi fordítás, felmérés, nyelvi modellképzés, valamint a nyelvtani elemzők
Magyarországon számos jelentős korpus érhető el, a Magyar Nemzeti Korpus, a Szegedi Tudományegyetem Korpusok és a