käännösaineistoa
Käännösaineistoa on termi, jota käytetään kuvaamaan kokoelmaa tekstiaineistoja, joita käytetään käännösten tutkimiseen, kehittämiseen tai harjoitteluun. Se kattaa sekä rinnakkaiset corpora (parallel corpora), joissa sama teksti on käännetty useaan kieleen ja jäsennelty riviveestein vastaaviin lauseisiin, että monikielisiä tai kaksikielisiä aineistoja, sekä monikielisiä käännöksiä ja käännösmuisteja. Käännösaineistoa hyödynnetään sekä kielenparien tutkimuksessa että koneellisen käännöksen (MT) ja tietokoneavusteisten käännösratkaisujen kehittämisessä.
Tyypillisiä käännösaineiston muotoja ovat rinnakkaiset corpora, joihin sisältyy alkuperäisteksti ja sen käännökset järjestettyinä rivi riviltä; alignoidut
Käyttötarkoitukset kattavat käännöstukien, MT-mallien ja terminologian kehittämisen, kielenparien tutkimisen sekä käännösprosessin koulutuksen. Käännösaineistoa hankitaan ja jaetaan