corpuslinguïstiek
Corpuslinguïstiek is de studie van taal door middel van corpora, grote digitale verzamelingen teksten of gesproken materiaal die elektronisch beschikbaar zijn en geannoteerd kunnen worden. Een corpus biedt empirische data die toelaten taalkundige patronen, variatie en verandering te beschrijven.
Het veld ontstond in de tweede helft van de twintigste eeuw met de opkomst van computers en
Een corpus kan verschillende vormen aannemen: algemene taalcorpora met grote aantallen teksten uit diverse genres, gespecialiseerde
Toepassingen omvatten lexicografie, beschrijving van grammaticale patronen, taalonderwijs en taaltechnologie, zoals training data voor natuurlijke taalverwerking