leksikaalikannat
Leksikaalikannat ovat kielellisten tutkimusten kohteena olevia leksikaalisten yksiköiden kokoelmia, jotka kuvaavat, mitä sanoja ja niiden muotoja tietyssä kielessä tai korpuksessa esiintyy. Ne voivat kattaa sekä koko kielen sanaston että tietyn aineiston erityispiirteet, ja niihin liitetään usein tietoja kuten lemmasanoista, sanaluokista, frekvensseistä sekä semanttisten kenttien rakenteesta.
Leksikaalikantojen rakentaminen perustuu suurten tekstiaineistojen keräämiseen, käsittelyyn ja annotointiin. Tekstiaineisto muunnetaan lemmasanoiksi ja niille annetaan sanaluokat;
Käyttötarkoituksia ovat sanakirjojen ja kielikuvan sekä kielitieteellisen tutkimuksen tukeminen, sanaston koon ja monipuolisuuden mittaaminen sekä semanttisen
Haasteisiin kuuluu murteiden ja tekstilajien varianssit, polyseemian hallinta, uusien sanojen ja muotojen synty sekä datan laatu