tekstipankkeja
Tekstipankki (monikko: tekstipankkeja) on järjestetty kokoelma kirjoitettua tekstiä, joka on koottu ja järjestetty uudelleenkäyttöä varten. Tekstipankkeja käytetään yleisesti opetuksessa, kieltenoppimisessa sekä tutkimuksessa ja luonnollisen kielen käsittelyssä (NLP). Aineisto voi olla monipuolista: kaunokirjallisuutta, oppimateriaaleja, uutisartikkeleita sekä teknisiä tai virallisia tekstejä.
Kokoelmien sisältö on usein luokiteltu erilaisten lajityyppien mukaan, ja osa pankkeista sisältää rinnakkaistekstejä eli parallel corpora
Käyttötavat: Opetuksessa ne tukevat lukutaito- ja sanaston harjoittelua sekä tekstianalyysia. Tutkimuksessa ne mahdollistavat korpus- ja kielellisen
Oikeudelliset ja eettiset näkökohdat: Tekstipankkien sisällön käyttö on sidottu tekijänoikeuksiin ja lisensseihin. Osa aineistosta on avoimesti