Home

Stoppwort

Stoppwort ist ein Begriff aus der Sprachverarbeitung und der Informationsbeschaffung. Er bezeichnet Wörter, die sehr häufig vorkommen und in der Regel wenig semantische Informationen tragen, wie Funktionswörter (Artikel, Präpositionen, Konjunktionen, Personalpronomen). Stoppwörter werden oft auch als Funktionswörter oder Stoppwortlisten bezeichnet.

In der Praxis spielen Stoppwörter eine zentrale Rolle beim Informationszugriff. In Suchmaschinen und Textverarbeitungssystemen werden sie

Stoppwortlisten sind sprach- und domänenspezifisch. Es gibt allgemein gültige Listen für verschiedene Sprachen, doch je nach

Typische Beispiele für deutsche Stoppwörter sind der, die, das, und, in, zu, den, von, mit, auf, ist,

häufig
bei
der
Indexierung
entfernt,
um
die
Datenmenge
zu
reduzieren
und
Suchanfragen
schneller
zu
verarbeiten.
Dadurch
werden
weniger
irrelevante
Treffer
erzeugt
und
die
Effizienz
erhöht.
Allerdings
kann
das
Entfernen
von
Stoppwörtern
in
manchen
Kontexten
auch
die
Genauigkeit
mindern,
insbesondere
bei
Phrasenabfragen,
sentimentalen
Analysen
oder
bestimmten
linguistischen
Auswertungen,
bei
denen
auch
Funktionswörter
bedeutsam
sein
können.
Anwendungsgebiet
können
auch
spezielle
Listen
nötig
sein,
zum
Beispiel
für
Fachtexte
oder
soziale
Medien.
Manche
Systeme
entfernen
keine
Stoppwörter,
sondern
gewichten
sie
oder
behandeln
sie
kontextabhängig.
Neuere
Ansätze
verwenden
dynamische
oder
kontextbasierte
Stoppwortmodelle,
die
sich
aus
dem
jeweiligen
Korpus
ableiten
lassen.
im,
des,
dem,
eine,
auch.
Stoppwörter
spielen
damit
eine
differenzierte
Rolle:
Sie
dienen
der
Grammatik
und
Kohärenz,
während
in
vielen
Anwendungen
die
inhaltstragenden
Wörter
im
Vordergrund
stehen.