Frekvenslister
Frekvenslister er lister som ranger ord eller andre lingvistiske enheter etter hvor ofte de forekommer i et korpus. De kan vise absolutte tellinger eller relative frekvenser per million ord, og gir en rask oversikt over hvilke enheter som dominerer et språk eller et bestemt tekstområde.
Frekvenslister brukes i lingvistikk, leksikonutvikling og språkopplæring, samt i natural language processing. De ligger til grunn
Metoden innebærer å samle et representativt korpus, rense data og tokenize teksten, deretter telle frekvenser og
Begrensninger inkluderer korpuskvalitet og representativitet, domene- og tidsbias, vanskelig håndtering av morfologi i polymorfene språk, samt