kollokationsbasierte
Kollokationsbasierte Ansätze beziehen sich auf die Nutzung von Kollokationen—festen oder bevorzugten Wortverbindungen—als zentrale Informationsquelle in der Sprachbeschreibung und Verarbeitung. Eine Kollokation ist eine Sequenz von Wörtern, die häufiger gemeinsam auftreten, als durch reinen Zufall zu erwarten wäre. Typische Beispiele im Deutschen sind Phrasen wie „eine große Rolle spielen“, „guter Vorsatz“ oder „Schluss machen“, bei denen die individuelle Bedeutung der Einzelwörter allein nicht ausreicht, um das phrasale Muster zu erklären. Kollokationsbasierte Analysen unterscheiden sich von rein frequenzbasierten Ansätzen, indem sie die Festigkeit, Stabilität oder semantische Nähe solcher Verbindungen berücksichtigen.
In Linguistik und Computerlinguistik dienen kollokationsbasierte Methoden der lexikalischen Beschreibung, Semantiksermittlung und der Verarbeitung natürlicher Sprache.
Methoden umfassen die extraktion aus Korpusdaten sowie statistische Maße wie PMI (Mutual Information), Dice-Koeffizient oder t-Score,
Anwendungen finden sich in der Lexikografie (Kollokationsfelder in Wörterbüchern), im Sprachunterricht und Lernmaterial, in der maschinellen
Herausforderungen umfassen die Abgrenzung zwischen Kollokationen und Idiomen, Mehrdeutigkeit und Domainabhängigkeit, Datenknappheit für wenige Sprachen, sowie