standaardlemma
Standaardlemma is een concept in de lexicografie en computational linguistics. Het verwijst naar de standaard- of canonieke vorm van een woord die als referentie dient in een lexicon of taalverwerkingssysteem. Deze vorm, het lemma, fungeert als centraal knooppunt waar alle inflecties en varianten van het woord aan worden toegewezen.
De selectie van een standaardlemma gebeurt op basis van taalregels en soms praktische conventies binnen een
In de praktijk is de standaardlemma cruciaal voor lemmatisering, indexering en synoniemenbeheer. Inflected vormen zoals loopt,
Uitdagingen omvatten homoniemen die meerdere lemmas hebben, meervoudsvormen die afwijken van het lemma, en multiword expressions