Disambiguierung
Disambiguierung bezeichnet in der Sprach- und Informationstechnik das Klären der eigentlichen Bedeutung eines Begriffs oder Satzes, der mehrere Sinnmöglichkeiten besitzt. Ziel ist es, in einem gegebenen Kontext die beabsichtigte Sinnrichtung zu bestimmen.
Es unterscheidet zwei Hauptformen der Mehrdeutigkeit: Polysemie (eine Form mit mehreren verwandten Bedeutungen) und Homonymie (gleiche
Anwendungsbereiche: Wörterbücher, Suchmaschinen, Textverarbeitung, maschinelles Übersetzen, Named-Entity-Recognition, Wissensgraphen, und in Enzyklopädien wie Wikipedia die Disambiguierungsseiten, die
Techniken: Wort-Sinn-Disambiguierung (WSD) nutzt Kontextinformationen aus Textkorpora, statistische Modelle, maschinelles Lernen, Lexika und Wissensbasen. In der
Herausforderungen: kurze oder irreführende Kontexte, mehrsprachige Mehrdeutigkeit, neue Begriffe und Namen; Evaluation bleibt schwierig.
Beispiel: Bank kann Bank als Kreditinstitut oder Sitzbank bedeuten; die richtige Interpretation hängt vom umgebenden Text
---