stemmingtoimintoja
Stemmingtoimintoja tarkoitetaan sanojen muodon normalisointia siten, että taivutus- ja johdannaismutoja poistetaan ja sanat palautuvat yleisimpään stemmiinsä. Tavoitteena on vähentää sananmuotojen variaatiota ja helpottaa tekstin käsittelyä, kuten tiedonhakua ja tilastollista analyysiä.
Toimintamuodot jakautuvat sääntöihin perustuviiin stemmeriin ja algoritmisiin ratkaisuihin. Sääntöperusteiset stemmerit soveltavat kielikohtaisia taivutuskaavoja, kun taas Snowball-tyyppiset
Stemming on yleisesti osa luonnollisen kielen käsittelyn (NLP) putkea ja sitä käytetään esimerkiksi hakukoneissa sekä tekstin
Stemmingtoimintoja kehitetään kielikohtaisesti, ja niiden käyttö riippuu sovelluksesta sekä halutusta tiivistämis- ja tarkkuustasosta.