korpusmenetelmien
Korpusmenetelmät ovat kielitieteessä käytettyjä tutkimusmenetelmiä, jotka perustuvat suurten autenttisten kieliaineistojen eli korpusten analysointiin. Näiden menetelmien tavoitteena on kuvata ja kvantifioida kielen käyttöä suurella otoksella tekstejä tai puheaineistoja sekä tunnistaa kieliopillisia ja semanttisia rakenteita.
Keskeisiä tekniikoita ovat frekvenssianalyysi ja jakaumien tarkastelu sekä konkordanssit kuten KWIC-tulokset, jotka näyttävät hakusanan kontekstin. Kollokaatioanalyysit
Korpusten suunnittelussa huomioidaan koko, edustavuus, lähteet ja metatiedot. Korpukset voidaan luokitella yleiskorpuksiin, erikoiskorpuksiin sekä oppimis- tai
Rakentamiseen liittyy lisensointi- ja tekijänoikeusnäkökohdat sekä eettiset periaatteet ja tietosuoja. Annotaatio ja luotettavuus varmistetaan usein annotaattorien
Käyttöalueet ulottuvat kielitutkimuksesta sanakirjojen ja kieliopin kehittämiseen sekä kieliteknologiaan, kuten konekielentunnistukseen ja konekääntämiseen sekä kielenopetukseen. Korpusmenetelmien