Stoppwörtern
Stoppwörter, auch Stopwörter genannt, bezeichnet man Wörter, die in vielen Anwendungen der Textverarbeitung standardmäßig ignoriert oder mit geringerer Gewichtung behandelt werden. Dazu zählen häufig Funktionswörter wie Artikel, Präpositionen, Konjunktionen und gängige Pronomen. Der Begriff stammt aus der Information Retrieval und dem Text Mining.
Ziel ist es, die Dimensionalität eines Textkorpus zu verringern, die Größe von Indexen zu senken und die
Deutschsprachige Stoppwortlisten enthalten Beispiele wie der, die, das, und, in, zu, mit, von, ist. Engelsprachelisten beinhalten
Kritikpunkte betreffen die Kontextabhängigkeit von Bedeutungen: Das Entfernen von Stoppwörtern kann in manchen Fällen wichtige Informationen
Stoppwörter bleiben ein nützliches, aber kontextabhängiges Werkzeug in der Verarbeitung natürlicher Sprache und im Information Retrieval.