referenssimuodot
Referenssimuodot ovat kielitieteessä ja k natural language processingissa (NLP) käytettyjä sanojen perus- tai kantamuotoja, joita pidetään sanakantana ja taivutusten pohjana. Ne toimivat sanan lemmana, eli johdonmukaisena, taivutuksista erillisenä muotona, jonka avulla saman sanan kaikki taivutukset voidaan ryhmittää ja tunnistaa. Esimerkiksi suomen kielessä sanojen referenssimuotoina pidetään usein perusmuotoa tai lemmaa, kuten kirjoittaa (lemma) tai koira.
Käyttöalueet ja tarkoitus: Referenssimuotoja käytetään sanakirjoissa, sanastopalVELUIKSESSA sekä NLP-prosesseissa kuten sanaperustelluksessa (lemmatisaatio), morfologisessa analyysissä ja osan
Menetelmät ja lähteet: Referenssimuotoja määritettäessä käytetään sekä kielikohtaisia sanakirjoja että automaattisia lingvistisiä työkaluja, kuten lemmatisaatio- ja
Rajoitteet: Monimerkityksisyys, monikielisyys ja säännöllisyyden vaihtelut voivat vaikeuttaa yhtä ainoan referenssimuodon valintaa. Lisäksi lainasanat ja murteelliset