Lematyzacja
Lematyzacja, często nazywana również lematyzacją, to proces przetwarzania języka naturalnego polegający na sprowadzaniu wyrazów do ich formy podstawowej, czyli lematu. Celem jest normalizacja wariantów fleksyjnych i wyodrębnienie semantycznie istotnych jednostek leksykalnych, co ułatwia analizę tekstu, porównywanie dokumentów i wyszukiwanie informacji.
W odróżnieniu od stemmingu, który często tnie końcówki bez uwzględniania morfologii i kontekstu, lematyzacja dąży do
Zastosowania obejmują indeksowanie dokumentów, wyszukiwanie informacji, przetwarzanie danych tekstowych, tłumaczenia maszynowe i inne zadania NLP. Dzięki
Wśród popularnych narzędzi znajdują się Morfeusz i Morfeusz2 (lemmer i analizator morfologiczny dla polskiego), UDPipe oraz