Corporaanalyse
Corporaanalyse, også kalt korpusanalyse, er en systematisk undersøkelse av språkdata hentet fra korpora for å kartlegge mønstre og variasjon i språkbruken. Den kombinerer kvantitativ analyse av store tekstsamlinger med kvalitative tolkninger av kontekst og bruk.
Korpora er strukturerte tekstsamlinger som kan være monolinguale eller flerspråklige og omfatte ulike sjangre: aviser, litteratur,
Metoder inkluderer frekvensanalyse, kontekstsøk i koncordanser, kollokasjonelle analyser og n-gram-analyser, samt nøkkelordanalyse og longitudinelle studier. Forbehandling
En typisk forskningsprosess følger trinn: formulere et spørsmål, velge eller sette sammen relevante korpora, forbehandle og
Korpusanalyse brukes innen språkforskning, leksikografi, språkopplæring, natural language processing og digital humaniora. Den bidrar til utvikling
Utfordringer inkluderer representativitet og bias i utvalg, annotasjonskvalitet, opphavsrett og etiske spørsmål ved innsamling av tekster,