lemmatisaatio
Lemmatisaatio on luonnollisen kielen käsittelyn prosessi, jossa sanan taivutusmuodot palautetaan sanakirjassa esiintyvään perusmuotoon, eli lemmaksi. Tämän avulla teksti voidaan käsitellä yhdenmukaisesti riippumatta sanan taivutusmuodosta. Esimerkki: taivutusmuoto talossa palautuu lemmaksi talo.
Lemmatisaatio eroaa stemmingistä: lemmatisaatiossa tavoitellaan todellista sanakirjassa olevaa muotoa, kun taas stemming voi tuottaa epävarmoja tai
Menetelmät voivat olla sanakirjapohjaisia, sääntöpohjaisia tai tilastollisia sekä näiden yhdistelmiä. Suomen kielen rikas taivutus ja agglutinaatio
Käyttökohteita ovat tiedonhaku, tekstin normalisointi, kielentutkimus ja konekäännökset. Lemmatisointia hyödynnetään esimerkiksi hakukoneissa yhdenmukaistamaan haukumuotoja sekä analyysissä,