korpusstudier
Korpusstudier är en gren inom språkvetenskapen som analyserar språk genom stora samlingar av autentiskt språk, så kallade corpora. Genom att systematiskt samla in, märka och analysera språkligt material undersöks frekvens, variation och användning i olika register, tidsperioder och målgrupper.
Ett corpus är en stor, strukturerad samling lingvistiskt material, vanligtvis text eller transkriberat tal, ofta med
Metoder som används inom korpusstudier inkluderar frekvensanalys, konkordanssökningar, kollokations- och nyckelordsanalyser, n-gram-modeller och diachroniska studier av
Data kommer från olika typer av corpora: generella, genrebundna, speciella syner, lärar-/elevkorpora och parallella corpora för
Användningsområden inkluderar lexicografi, språkinlärning, utveckling av NLP-verktyg, sociolingvistik och stilistik. Resultaten används för ordlistor, frekvensbaserade lexikon