tekstuaineistoja
Tekstuaineistoja ovat kokoelmat kirjoitettua tekstiä, joita kerätään ja tallennetaan tutkimus- tai koulutustarkoituksiin. Ne voivat olla digitaalisessa muodossa tai skannattuja painettuja tekstejä. Tekstuaineistot voivat olla yksikielisiä tai monikielisiä ja ne kattavat eri genreja, kuten kirjallisuutta, uutisartikkeleita, viranomaisasiakirjoja sekä verkkotekstiä.
Tyypillisiä tekstuaineistoja ovat korpukset (korpus), arkistotekstiaineistot sekä verkkotekstit ja sosiaalisen median aineistot. Aineistot voivat keskittyä yhteen
Käyttötarkoitukset vaihtelevat kielitieteestä digitaaliseen humanismiin ja tekoälyyn. Tekstuaineistoja käytetään sanaston, morfologian, syntaksin ja semantiikan tutkimukseen sekä
Laatu ja eettiset näkökohdat ovat keskeisiä. Edustavuus, kattavuus ja laadunvarmistus vaikuttavat tutkimustuloksiin. Henkilötietojen suoja, anonymisointi ja
Hallinta ja saatavuus perustuvat asianmukaisiin metatietoihin ja kuvailuun, jotka helpottavat tiedon löytämistä. Monet tekstuaineistot pyritään julkaisemaan