Frequenzensammlung
Frequenzensammlung bezeichnet in der Sprachwissenschaft und verwandten Feldern eine Zusammenstellung von Häufigkeitsstatistiken über eine Menge von Elementen, meist Wörtern, Morphemen oder Lautformen. Sie basiert typischerweise auf der Auszählung von Vorkommnissen in Textkorpora, Experimentdaten oder anderen Datensätzen. In einer Frequenzsammlung werden sowohl absolute Frequenzen (die reinen Zählwerte) als auch relative Frequenzen (Anteile am Gesamtvorkommen) aufgeführt. Ziel ist es, Muster der Sprachverwendung zu quantifizieren, zu vergleichen und Modelle der Sprachstruktur zu unterstützen.
Eine Frequenzsammlung enthält oft Ranglisten der häufigsten Elemente, Verteilungen der Häufigkeiten über Kategorien oder Genres sowie
Anwendungen reichen von Lexikografie, Spracherkennung, maschinellem Lernen und Textvorhersage bis hin zu Datenkompression und psycholinguistischen Studien.