Home

Syntaxverarbeitung

Syntaxverarbeitung bezeichnet allgemein den Prozess, durch den Sätze auf ihre syntaktische Struktur hin analysiert werden. In der Linguistik befassen sich damit Forschende mit der Frage, wie Menschen beim Verstehen von Sprache Grammatikstrukturen, Hierarchien und Abhängigkeiten aktiv rekonstruieren. In der Informatik und im Bereich der natürlichen Sprachverarbeitung (NLP) bezeichnet der Begriff oft den automatischen Prozess des Parsings, also der Zuweisung einer syntaktischen Struktur zu einem gegebenen Satz.

Linguistische Perspektiven: Modelle des Satzverstehens reichen von rein seriellen, schrittweisen Ansätzen bis hin zu inkrementellen oder

Technische Perspektive/NLP: Parser verwenden Grammatikformalismen wie kontextfreie Grammatiken (CFG), Abhängigkeitsgrammatiken oder kognitive Kategorien; es gibt probabilistische

Herausforderungen umfassen Mehrdeutigkeit, lange Abhängigkeiten, nicht-projektive Abhängigkeiten in einigen Sprachen, Ressourcengröße, Sprachen mit wenig annotierten Daten

constraint-basierten
Theorien.
Gängige
Phänomene
sind
Mehrdeutigkeiten
und
Gartenpfad-Verarbeitung,
bei
der
der
Leser
frühere
Annahmen
revidieren
muss.
Arbeiten
berücksichtigen
auch
Gedächtnisbeschränkungen,
Verarbeitungsgeschwindigkeit
und
sprachübergreifende
Unterschiede.
bzw.
statistische
Parser.
Zu
den
Algorithmen
gehören
Chart
Parsing,
Top-Down/Bottom-Up
Parsen,
Shift-Reduce-Parsing.
Häufige
Vertreter
sind
konstituentenbasierte
Parser
und
Abhängigkeits-Parser.
Große
annotierte
Korpora
(z.
B.
Penn
Treebank,
Universal
Dependencies)
dienen
als
Trainings-
und
Evaluationsgrundlage.
Anwendungen
umfassen
maschinelle
Übersetzung,
Informationsextraktion,
Frage-Antwort-Systeme
und
Spracherkennung,
sowie
syntaktische
Merkmalslieferung
für
darauffolgende
NLP-Aufgaben.
Evaluationsmaße
umfassen
UAS
(Unlabeled
Attachment
Score),
LAS
(Labeled
Attachment
Score)
sowie
Genauigkeit
konstituentenbasierter
Bracketing.
sowie
Realzeitanforderungen
in
Anwendungen.