Informatieextractie
Informatieextractie is het proces waarbij automatisch gestructureerde informatie wordt afgeleid uit ongestructureerde of halfgestructureerde bronnen, zoals teksten, rapporten, e-mails en webpagina’s. Doel is om relevante feiten, entiteiten en relaties in een computers leesbaar formaat vast te leggen, bijvoorbeeld als records, triples of JSON-structuren.
Belangrijke taken binnen informatieextractie zijn onder meer naamgevingherkenning (NER) voor personen, organisaties en locaties; relatie-extractie die
Output van informatieextractie bestaat doorgaans uit gestructureerde data zoals entiteiten met labels, relationele triples of gestandaardiseerde
Toepassingen bevinden zich in onder meer business intelligence, compliance en risicoanalyse, informatie-ontsluiting in bibliotheken en wetenschappelijke