discourseannotaties
Discourseannotaties zijn labels die aan tekstsegmenten worden toegewezen om de structuur en relaties van een tekst op discourse-niveau vast te leggen. Ze geven aan hoe zinnen en zinsdelen op elkaar reageren, welke functie een deel van de tekst heeft (bijvoorbeeld oorzaak, gevolg, toelichting) en hoe samenhang en coherentie in het geheel ontstaan. Deze annotaties worden toegepast in taalkunde en natuurlijke taalverwerking om tekst beter te begrijpen, te analyseren en automatisch te verwerken.
Veelgebruikte annotatieschema's omvatten Rhetorical Structure Theory (RST), Penn Discourse Treebank (PDTB) en SDRT (Segmentation and Discourse
Het annotatieproces omvat het opstellen van richtlijnen, training van annotatoren, en kwaliteitscontrole. Vaak wordt de betrouwbaarheid
Toepassingen van discourseannotaties zijn onder meer betere automatische samenvattings- en vraag-antwoord-systemen, verbeterde tekst- en documentanalyse, dialogen
Uitdagingen bij discourseannotatie omvatten onder meer subjectiviteit en inconsistenties tussen annotatoren, variatie tussen talen en genres,