worteldichtheid
Worteldichtheid, ook wel lexicale dichtheid genoemd, is een maat in de linguïstiek die aangeeft welk deel van een tekst uit inhoudswoorden bestaat. Meestal wordt dit berekend als de procentuele verhouding van inhoudswoorden (zoals zelfstandige naamwoorden, inhoudswerkwoorden, bijvoeglijke en bijwoordelijke woorden) tot het totale aantal woorden in de tekst. Functiewoorden (lidwoorden, voornaamwoorden, voorzetsels, voegwoorden en sommige hulpwerkwoorden) dragen minder semantische inhoud en worden meestal niet meegerekend als inhoudswoorden.
Berekenen gebeurt door de tekst te tokeniseren en met part-of-speech tagging te classificeren welke woorden inhoudswoorden
Toepassingen: worteldichtheid geeft een maat voor de informatiedichtheid en complexiteit van een tekst. Een hogere dichtheid
Beperkingen en nuances: de grens tussen inhouds- en functiewoorden varieert per taal en parsingmethode. Morfologische rijkdom