Entitätenerkennung
Entitätenerkennung, auch bekannt als Named Entity Recognition (NER), ist eine Aufgabe der natürlichen Sprachverarbeitung (NLP), bei der Textpassagen identifiziert und als Entitäten kategorisiert werden. Typische Kategorien umfassen Personen, Organisationen, Orte, Datum/Zeit, Mengen, Werke und Produktbezeichnungen. Das Ziel ist die Extraktion strukturierter Informationen aus unstrukturiertem Text.
Methoden reichen von regelbasierten Ansätzen über statistische Modelle bis zu modernen neuronalen Netzwerken. Früher setzten Systeme
Auswertung erfolgt üblicherweise anhand von Präzision, Recall und F1-Score. Anwendungsgebiete umfassen automatisierte Informationsextraktion, Frage-Antwort-Systeme, Textzusammenfassungen, Suchmaschinen
Herausforderungen bestehen in Mehrdeutigkeit und kontextabhängiger Zuordnung, verschachtelten Entitäten, Domain- und Sprachwechseln sowie begrenzten Annotationen für