tekstiaineistoja
Tekstiaineistot tarkoittavat kokoelmia kirjoitettua tekstiä, joita käytetään tutkimuksessa, kielitieteessä, kieliteknologiassa ja koulutuksessa. Ne voivat olla digitaalisia tai historiallisia sekä kattaa sekä yhden kielen että useamman kielen tekstejä. Aineistot sisältävät erilaisia tekstilajeja, kuten kaunokirjallisuutta, uutisartikkeleita, viranomaisasiakirjoja, verkkotekstejä ja puhuttua kieltä koskevia transkriptioita. Tekstiaineistojen tarkoituksena on tarjota edustava, analysoitavissa oleva kokoelma kielen rakenteiden, sanaston ja käytäntöjen tutkimukseen.
Rakenne ja merkinnät: Tekstiaineistoilla voi olla pelkkää raakatekstiä tai niihin liittyy erilaisia annotaatioita, kuten sanaluokkia, lemmattuja
Keräys ja oikeudet: Tekstiaineistoja kerätään eri lähteistä, kuten julkaistuista kokoelmista, verkkosivuilta, digitoinneista ja puheentunnistuksen avulla tuotetuista
Merkitys ja käyttö: Tekstiaineistot muodostavat keskeisen perustan kielitieteelliselle tutkimukselle, sanastotyölle, kieliteknologian kehittämiselle sekä historialliselle ja kulttuurilliselle