Entiteitskoppeling
Entiteitskoppeling is het NLP-proces waarbij vermelde entiteiten in tekst worden gekoppeld aan een eenduidige entiteit in een externe kennisbasis, zoals Wikidata of een bedrijfskennisgrafiek. Het doel is om vage verwijzingen te vervangen door concrete, gestandaardiseerde entiteiten voor betere aggregatie en analyse.
Een typische workflow bestaat uit drie onderdelen: entiteitsdetectie (NER), kandidaatgeneratie (het zoeken van mogelijke matchende entiteiten
Methoden variëren van supervised tot unsupervised en semi-supervised benaderingen. Veel gebruikte kenmerken zijn de context rond
Toepassingen omvatten verbeterde zoekfunctionaliteit, vraag beantwoording, semantische verrijking en populatie van kennisgrafieken. Entiteitskoppeling ondersteunt data-integratie door
Beoordeling gebeurt met precisie, recall en F1-score op benchmarks zoals AIDA en TAC KBP, die zowel mention-niveau
Uitdagingen zijn ambiguïteit, polyseem, beperkte trainingsdata voor minder voorkomende entiteiten, en schaal- en taaldomeinen bij meertalige
Entiteitskoppeling is verwant aan entiteitsoplossing (entity resolution) maar verschilt: koppeling selecteert externe, gestandaardiseerde entiteiten in een