korpusanalyysit
Korpusanalyysit ovat kielitieteellisiä tutkimusmenetelmiä, joissa tutkitaan suuria, elektronisesti tallennettuja tekstiaineistoja tai puheaineistoja. Korpusaineiston avulla voidaan kartoittaa sanaston käyttöä, syntaktisia rakenteita sekä kielen variaatiota eri genrejen, aikakausien ja puhujien välillä. Korpusanalyysi perustuu usein tilastollisiin ja kvantitatiivisiin menetelmiin, mutta siihen voi liittää myös laadullisen analyysin.
Korpukset eli kokoelmat tekstiä tai puhetta voivat olla yleisiä, kuten suuria yleiskorpuksia, tai erikoistuneita, esimerkiksi uutis-,
Menetelmät ja mittarit: sanatason tilastointi eli frekvenssit; kollokaatioanalyysi; konkoranssit; n-gram- ja syntaktinen analyysi; sekä osatunnistus (POS-tunnistus)
Sovelluksia ovat sanakirjojen ja terminologian laatiminen, kieltenopetus, luonnollisen kielen käsittely (NLP) sekä kielen käyttöä koskeva tutkimus,
Korpusanalyysien toteutuksessa käytetään erilaisia työkaluja sekä alustoja, kuten concordancer-työkaluja, tilastollisia ohjelmistoja ja erityisiä korpustenhallintajärjestelmiä (esim. Sketch