Usagetunnused
Usagetunnused on metadata kogum, mida kasutatakse keelelise andmestiku annotatsioonis, et kirjeldada, kuidas sõna või vormi tegelikult kasutatakse kontekstis. Need peegeldavad kasutusviisi ja diskursiivset funktsiooni ning ei keskendu pelgalt grammatikalistele vormidele või tähendustele eraldi. Usagetunnuseid kogutakse, et aidata arvutuslikul töötlusel mõista keelekasutust erinevates olukordades.
Usagetunnuseid võib kategoriseerida mitmel viisil. Tavaliselt hõlmavad need registreeringut (formaalne vs mitteformaalne keel), domeeni või žanri
Usagetunnuseid kasutatakse peamiselt korpusteaduses ja loomuliku keele töötluses (NLP). Need võimaldavad täpsemalt kirjeldada, kus, millal ja
Väljakutsed hõlmavad subjektiivsust ja eelistuste erinevusi, standardiseerimise raskust, keele muutumise dünaamikat ning piirkondlike ja domenipõhiste erinevuste