stopwordien
Stopwoorden zijn woorden die in veel tekstverwerking buiten beschouwing worden gelaten omdat ze weinig onderscheidende informatie leveren. In het Nederlands wordt gesproken over stopwoorden of stopwoordlijsten. Typische stopwoorden zijn lidwoorden (de, het, een), voornaamwoorden (dit, dat, u), voegwoorden (en, of, maar) en voorzetsels (in, op, met, van). Het doel van stopwoorden is ruis te verminderen en de efficiëntie en effectiviteit van analyse te vergroten.
In informatieopvraging en tekstmining worden documenten vaak eerst opgeschoond door stopwoorden te verwijderen voordat technieken als
Er zijn beperkingen. Het verwijderen van stopwoorden kan in sommige taken leiden tot verlies van nuance of
Samenvattend vormen stopwoorden een basisinstrument in NLP en informatiesystemen om tekstueel materiaal beter hanteerbaar te maken,