structuurannotatie
Structuurannotatie is het systematisch toekennen van labels aan de syntactische structuur van teksten, met als doel de hiërarchische organisatie van taalelementen zoals zinsdelen, woorden en hun relaties in kaart te brengen. Daarbij worden vaak ook basisbewerkingen als zinssegementatie, tokenisatie en lemmatizatie toegepast, omdat deze preprocessing de analyse van structuur ondersteunt.
De twee belangrijkste tradities in structuurannotatie zijn constituente (frase-structuur) annotatie en afhankelijkheidsannotatie. Constituente annotatie beschrijft de
Standardisatie en praktijken spelen een belangrijke rol: universal dependencies (UD) biedt een breedgedragen set van labels
Uitdagingen zijn onder meer ambiguïteit, kosten van handmatige annotatie en de noodzaak om verschillende lagen (syntax,