lemmatizácia
Lemmatizácia je proces v spracovaní prirodzeného jazyka, ktorý redukuje ohnuté alebo inak odvodené formy slov na ich základný tvar, známy ako lemma. Napríklad slová "bežím", "bežal" a "beží" by boli všetky lemmatizované na slovo "bežať". Podobne slová ako "knihy" a "kniha" by sa zredukovali na "kniha". Cieľom lemmatizácie je normalizovať slová tak, aby ich bolo možné analyzovať a porovnávať konzistentne.
Na rozdiel od tzv. stemmingu, ktorý často jednoducho odrezáva koncovky slov, lemmatizácia využíva slovníkovú znalosť a
Lemmatizácia je kľúčovým krokom v mnohých úlohách spracovania prirodzeného jazyka, vrátane vyhľadávania informácií, strojového prekladu, analýzy