natuurtaalverwerking
Natuurtaalverwerking (NLP) is een vakgebied binnen de kunstmatige intelligentie dat zich richt op de interactie tussen computers en menselijke taal. Het doel is computers in staat te stellen taal te begrijpen, interpreteren en genereren in tekst of spraak. NLP omvat zowel eenvoudige taaltaken als complexe taken zoals dialoogsystemen.
Belangrijke basistaken zijn tokenisatie, lemmatizering, het taggen van delen van de spraak, syntactische parsing en named
Historisch gezien ontstond NLP uit regelgebaseerde systemen en statistische methoden, maar de afgelopen decennia domineren data-gedreven
Toepassingen bevinden zich in zoekmachines, chatbots en virtuele assistenten, automatische vertaling, samenvatting van documenten en tekstanalyse
Prestaties worden gemeten met benchmarks en corpora. Veelgebruikte evaluatiemethoden zijn nauwkeurigheid, F1-score, BLEU of ROUGE voor
Belangrijke uitdagingen zijn bias in data en modellen, privacy en beveiliging, interpretabiliteit, en de verantwoorde toepassing
Natuurtaalverwerking heeft zich sinds de jaren vijftig ontwikkeld van eenvoudige regelgebaseerde systemen naar krachtige, data-gedreven modellen