stemmingmechaniek
Stemmingmechaniek is een term die wordt gebruikt om het geheel van regels, algoritmen en procedures te beschrijven die worden toegepast om woorden terug te brengen tot hun stam of kernvorm in tekstverwerking. Het doel is om morfologische varianten van een woord te groeperen zodat zoekopdrachten en analyses efficiënter en consistenter verlopen. Stemming verschilt van lemmatization doordat het doorgaans rule-based en onvolledig nauwkeurig is, en vaak niet naar een correcte lemme terugleidt, maar eerder een praktische basisvorm oplevert.
In de praktijk bestaan stemmingmechanieken uit taalspecifieke afleidingsregels die achtervoegsels en soms voorvoegsels verwijderen; algoritmen zoals
Toepassingen omvatten informatieopvraging, indexering van documenten, document clustering en tekstanalyse. Een belangrijk aspect van de stemmingmechaniek