Korpusgebaseerde
Korpusgebaseerde is een aanduiding voor onderzoeksmethoden, analyses of conclusies die gebaseerd zijn op een korpus. Een korpus is een systematisch verzamelde en geannoteerde verzameling teksten die taalgebruik uit een bepaald domein, tijdperk of taalvariant representeert. Korpusgebaseerde benaderingen vormen een tegenhanger van theorie- of intuïtief gebaseerde beschrijvingen van taal, omdat ze vertrouwen op empirisch materiaal uit echte teksten.
In de praktijk wordt met korpusdata taalgebruik onderzocht door middel van frequentieanalyse, concordanties, het opsporen van
Toepassingen omvatten lexicografie, natuurlijke taalverwerking (NLP), taalonderwijs, terminologie-extractie en vertaalhulpmiddelen. Een kernpunt is dat conclusies vaak