kielivarojen
Kielivarat ovat kielitieteen ja kieliteknologian tutkimuksessa ja kehittämisessä käytettävissä aineistoissa, työkaluissa sekä niihin liittyvässä metadata. Ne kattavat esimerkiksi tekstiaineistot, puheaineistot, sanakirjat ja kieliopit sekä annotoidut kokoelmat ja semanttiset resurssit kuten ontologiat. Kielivarat voivat olla julkisia tai rajatusti saatavilla, ja niiden kattavuus sekä käyttöoikeudet vaihtelevat suuresti.
Käyttötarkoitukset: Kielivarat tukevat kielen ymmärtämistä, kieltä tutkivaa tutkimusta sekä kieliteknologian kehittämistä. Ne mahdollistavat tilastollisen analyysin, konekäännökset,
Rakenne ja standardit: Tyypillisiä kielivaroja ovat tekstiaineistot (korpukset), puhe- ja ääniaineistot sekä niiden annotointi (morfologia, syntaksi,
Hallitseminen ja etiikka: Kielivarojen jakaminen ja käyttö perustuvat lisensseihin (esim. CC-lisenssit tai tutkimuskäyttöön tarkoitetut lisenssit). Tietosuoja
Infrastruktuuri ja yhteentoimivuus: Tutkijayhteisöt, kuten CLARIN ja ELRA, kehittävät infrastruktuureja kielivarojen löytämiseksi, jakamiseksi ja yhteentoimivuuden tukemiseksi.