puheaineistoissa
Puheaineistoissa tarkoitetaan tallennettua ja transkriptoitua puhetta, jota käytetään kielitieteellisessä ja lähdekoodipohjaisessa tutkimuksessa. Puheaineistot voivat olla suuria ja monipuolisia sekä yhden kielen että useamman kielen kattavia. Ne sisältävät usein sekä spontaania puhetta että puhuttua, siihen liittyvää kontekstia ja eri rekistereistä kerättyä kieltä.
Aineiston keruussa ja transkriptoinnissa kiinnitetään huomiota sekä äänitteiden laadintaan että syntyneiden tekstien rakenteeseen. Keruu voi tapahtua
Eettiset ja oikeudelliset näkökohdat korostuvat: suostumus, anonymisointi, tekijänoikeus ja käyttöoikeudet sekä mahdolliset lisenssi- ja jakelumrra b.
Käyttökohteet ovat moninaiset: syntaksin ja sanastovirtaan tutkailu, virhe- ja variaatiotutkimus, vihjeet prosodian funktion löytämiseen sekä puheentunnistuksen