etiketteersystemen
Etiketteersystemen, ook wel tagging- of labelingsystemen genoemd, zijn systemen die inputdata voorzien van labels. In NLP worden woorden of zinnen geclassificeerd met grammaticale tags (bijv. POS-tags), entiteitslabels (named entity recognition) of andere annotaties. In bredere zin kan een etiketteersysteem ook beelden, geluid of structuur in documenten labelen.
Een etiketteerproces bestaat meestal uit een vooraf gedefinieerde labelset, de invoerdata, een model dat labels toewijst
Methoden: regelgebaseerde systemen gebruiken handmatige regels; statistische modellen zoals Hidden Markov Models en Conditional Random Fields
Evaluatie gebeurt met maatstaven als nauwkeurigheid, precisie, recall en F1-score; voor sequentie-labeling wordt vaak de F1-score
Toepassingen omvatten voorbewerkingen voor informatie-extractie, zoek- en vraagbeantwoording, machinaal vertalen en medisch coderen. Uitdagingen bestaan uit
Noviteiten omvatten pretrained taggingmodellen en cross-linguale taggers; ethische en privacy-implicaties spelen ook een rol.