Home

corpusgerelateerde

Corpusgerelateerde is een term die in het Nederlands wordt gebruikt om aan te geven dat iets verband houdt met of gebaseerd is op corpora. In de taalkunde en verwante disciplines verwijst het naar benaderingen, data en bevindingen die voortkomen uit gestructureerde verzamelingen van taalgebruik, zoals geschreven teksten of gesproken corpora. Daarmee onderscheidt een corpusgerelateerde aanpak zich door te vertrouwen op grote, authentieke taalgegevens in plaats van op beperkte of volledig theoretische voorbeelden.

Typische werkwijzen in corpusgerelateerde onderzoek bestaan uit het bouwen en annoteren van corpora, het berekenen van

In lexicografie, taalonderwijs, vertaalonderzoek en natuurlijke taalverwerking wordt corpusgerelateerde onderzoek gebruikt om woordbetekenissen en gebruiksfrequenties te

Belangrijke overwegingen zijn representativiteit van het corpus, genre- en registerbias, annotatiekwaliteit en de contextafhankelijkheid van taalgebruik.

---

frequenties,
het
analyseren
van
collocaties
en
syntactische
patronen,
en
het
toepassen
van
statistische
methoden
om
patronen
te
toetsen.
Het
gebruik
van
concordanties
en
variantieanalyse
helpt
bij
het
blootleggen
van
taalkundige
generalisaties
die
gelden
binnen
specifieke
domeinen
of
registers.
beschrijven,
lexicale
verwantschappen
te
modelleren,
of
materialen
en
hulpmiddelen
te
ontwikkelen.
Het
biedt
concrete,
empirische
aanknopingspunten
voor
beschrijving
en
onderwijs
en
kan
ondersteuning
bieden
bij
de
ontwikkeling
van
taaltechnologieën
zoals
spellings-
en
grammar
checkers.
Soms
worden
termen
als
corpusgerelateerde,
corpusgebaseerde
en
corpusgestuurde
benaderingen
door
elkaar
gebruikt;
in
de
literatuur
verwijzen
ze
vaak
naar
verwante
maar
soms
onderscheiden
invalshoeken:
data-gedreven
versus
theorie-gedreven
onderzoek.