frekvenslisten
Frekvenslisten, ofte kalt en ordfrekvensliste, er en rangert oversikt over ord eller morfemer etter hvor ofte de forekommer i et språk innenfor et definert korpus eller domene. Den gir et overblikk over hvilke ord som er mest utbredt og kan brukes som grunnlag i forskning, ordbokarbeid og språkopplæring.
Frekvenslister bygges ved å telle forekomster av ord i et tekstsamling, og deretter beregne relative frekvenser,
Bruksområder inkluderer prioritering ved ordbokutvikling, språkopplæring, språkforståelse i NLP-systemer, tekstanalyse og stilvurdering. Stopplister er ofte basert
Ulike korpora gir ulike lister, og representativitet er viktig. Genre, stil, dialekt og tidsperiode påvirker frekvensene,
Se også: korpuslingvistikk, ordfrekvens, lemmatisering, stoppliste.