lemmatoinnissa
Lemmatoinnissa sanan taivutusmuodosta pyritään löytämään sen lemmaversio, eli sanakirjassa esiintyvä perusmuoto. Esimerkiksi taivutusmuodot kuten koirien, koirat ja koirilla palautetaan lemmaksi sana koira. Lemmatisointi on keskeinen vaihe luonnollisen kielen käsittelyssä (NLP), jossa tekstin semanttista ja syntaktista tulkintaa helpotetaan palauttamalla sanojen perusmuodot.
Eroa stemmingistä on usein korostettu: stemming on heuristinen, affiksien leikkaaminen ilman varmuutta siitä, mikä on oikea
Menetelmät lemmatoinnissa vaihtelevat sääntöihin ja sanakirjoihin perustuvista ratkaisuista tilastollisiin ja neuroverkkoihin pohjautuviin malleihin. Perinteiset järjestelmät yhdistävät
Käyttötarkoitukset kattavat hakukoneet, tiedon louhinnan, konekäännökset sekä tekstianalyysin eri alueet. Lemmatisoinnin laatu riippuu kieli-, sane- ja