tekstiaineistossa
Tekstiaineistossa on suomenkielinen ilmaus, jota käytetään viittaamaan kielelliseen aineistoon, joka on koottu tutkimus- tai kehitystarkoituksiin. Tekstiaineisto tarkoittaa systemaattisesti kerättyä kokoelmaa teksteistä, joita analysoidaan ohjelmallisesti. Tekstiaineistossa viitataan tilaan, jossa nämä tekstit sijaitsevat; esimerkiksi lauseessa "Tekstiaineistossa havaitaan..." viitataan siihen, että tulokset perustuvat kyseiseen kokoelmaan.
Käyttötarkoitukset: Korpologiaan yleisesti kuuluu aineiston kuvaus: lähteet, kieli, genre ja aikakausi. Tekstiaineistossa voidaan tehdä sanapainojen laskentaa,
Rakenteesta ja tallennusmuodoista: Tekstiaineistot voivat olla tekstitiedostoja, XML- tai TEI-merkintöineen, tai JSON-rajapintoja käyttäviä kokoelmia. Ennen analyysiä
Laadunvarmistus ja eettisyys: Tekstiaineiston käyttöön liittyy tekijänoikeudet, yksityisyyden suoja sekä edustavuuden ja muuttujien mittaus. Hyvin dokumentoidut