bokstavsfrekvens
Bokstavsfrekvens beskriver hur ofta olika bokstäver förekommer i en text. Den relativa frekvensen räknas vanligtvis som andelen av totalt antal bokstäver som varje tecken utgör, ofta uttryckt i procent. I svenskspråkiga texter ingår ofta de svenska bokstäverna å, ä och ö i analysen, utöver de övriga bokstäverna i det latinska alfabetet.
Frekvensmönster varierar mellan språk, genrer och textlängd. I många språk dominerar vissa bokstäver, särskilt vokalerna. I
Frekvensdata används i flera områden. Inom kryptografi har frekvensanalys historiskt varit ett verktyg för att avkoda
Så hanteras data vanligtvis genom att samla ett textkorpus, räkna förekomsterna för varje bokstav, normalisera (till