lemmatizácie
Lemmatizácia je proces v spracovaní prirodzeného jazyka, ktorý redukuje ohnuté alebo inak odvodené formy slov na ich základnú formu alebo lexikón, známy ako lema. Na rozdiel od stemmingu, ktorý jednoducho odrezáva koncovky slov, lemmatizácia používa slovník a morfologickú analýzu slova, aby pochopila jeho kontext a vrátil správnu základnú formu. Napríklad, lemmatizácia slova "bežal" by vrátila "bežať", zatiaľ čo stemming by mohol skončiť s "bež" alebo niečo podobné, čo nemusí byť platné slovo.
Cieľom lemmatizácie je zoskupiť rôzne tvary slova pod jedným spoločným záznamom v slovníku. Toto je kľúčové pre
Výsledkom lemmatizácie je lema, ktorá je v podstate základným slovníkovým tvarom slova. Tento proces si vyžaduje