nGrammModelle
nGrammModelle, auch n-Gramm-Modelle genannt, sind statistische Sprachmodelle, die die Wahrscheinlichkeit einer Wortfolge anhand der Häufigkeit von n-grammen schätzen. Sie basieren auf dem Markov-Ansatz, der annimmt, dass jedes Wort w_t abhängig ist von den vorherigen n−1 Wörtern. Die Wahrscheinlichkeit einer Sequenz w1,...,wT wird approximativ als Produkt von P(w_t | w_{t-n+1}, ..., w_{t-1}) berechnet.
Je nach Granularität unterscheidet man Wort-n-Gramme und Zeichen-n-Gramme. Typische Werte für n liegen zwischen 1 und
Anwendungsgebiete umfassen Spracherkennung, Textgenerierung, Autovervollständigung, maschinelle Übersetzung (als Baustein) sowie die statistische Analyse von Texten. N-Gramm-Modelle