Frequenzvergleiche
Frequenzvergleiche bezeichnen den Vergleich der Häufigkeiten von Ereignissen, Merkmalen oder Kategorien in unterschiedlichen Datensätzen oder Zeiträumen. Ziel ist es, Muster zu erkennen, Unterschiede zu quantifizieren und trendhafte oder kulturelle Unterschiede zu verstehen. Dabei werden rohe Zählungen in relative Häufigkeiten umgewandelt, damit Vergleiche über verschiedene Stichproben möglich sind.
Bei der Durchführung werden konsistente Definitionen von Ereignissen vorausgesetzt, Daten sorgfältig erhoben und ggf. normalisiert. Typische
Anwendungsbereiche umfassen Linguistik und Corpusforschung (Wort- oder Lemmahäufigkeit), Signal- und Bildverarbeitung (Vorkommen bestimmter Merkmalswerte), Epidemiologie und
Statistische Techniken zur Beurteilung von Frequenzvergleichen umfassen Kontingenztafeln, Chi-Quadrat-Tests, Tests für Anteile (z-Tests), sowie nichtparametrische Verfahren
Wichtige Grenzfälle sind unterschiedliche Stichprobengrößen, zeitliche oder räumliche Heterogenität, Selektionsbias und Mehrfachvergleiche. In solchen Fällen sind
Beispiel: In zwei Textkorpora wird die Häufigkeit des Wortes "Daten" gemessen. Die relativen Häufigkeiten p1 und