Home

Wortgrenzen

Wortgrenze bezeichnet die Grenzlinie zwischen zwei Wörtern in einem Text oder einer gesprochenen Äußerung. Sie markiert, wo ein Wort endet und das folgende beginnt, und spielt eine zentrale Rolle in der Sprach- und Textverarbeitung.

In der geschriebenen Sprache werden Wortgrenzen in vielen Schriftsystemen durch Leerzeichen markiert. Satzzeichen helfen zusätzlich bei

Im Deutschen ist die Bestimmung der Wortgrenze aufgrund zahlreicher Zusammensetzungen besonders anspruchsvoll. Viele Einheiten entstehen durch

In der Sprach- und Textverarbeitung ist die Bestimmung von Wortgrenzen eine Grundvoraussetzung für Aufgaben wie Tokenisierung,

der
Strukturierung
von
Sätzen.
In
Sprachen
oder
Schriftsystemen
ohne
klare
Zwischenräume
müssen
Wortgrenzen
oft
durch
Analyse
ermittelt
werden.
Bei
der
Textverarbeitung
gehört
auch
die
Zeilenumbruch-Hyphenation
zur
Behandlung
von
Wortgrenzen:
Hier
werden
mögliche
Bruchstellen
definiert,
an
denen
ein
Wort
am
Zeilenrand
geteilt
werden
darf.
Vereinigung
mehrerer
Morpheme
zu
einem
einzigen
Wort,
wodurch
interne
Grenzlinien
häufig
nicht
sichtbar
sind.
Für
die
automatische
Verarbeitung
werden
deshalb
Morphologie
und
Segmentierung
eingesetzt,
um
Stamm,
Präfix,
Suffix
oder
potenzielle
Morphemgrenzen
zu
identifizieren.
Bei
Textauszeichnung,
Suchindizes
oder
Umbrüchen
müssen
oft
mehrere
mögliche
Bruchstellen
bewertet
werden.
Spracherkennung,
maschinelles
Lernen
und
Informationsabruf.
Ebenso
relevant
ist
sie
für
optische
Zeichenerkennung
(OCR)
und
die
korrekte
Silbentrennung
bei
der
Formatierung
von
Texten.
Insgesamt
beschreibt
Wortgrenze
die
konstruktive
Grenze
zwischen
Wörtern
und
ihren
je
unterschiedlichen
Erscheinungsformen
in
Schrift
und
Sprache.