stopsanat
Stopsanat, eli stop words, ovat sanoja, joita usein suodatetaan ennen tekstin käsittelyä hakukoneissa, tiedonhakujärjestelmissä ja muissa luonnollisen kielen käsittelyn tehtävissä. Ne ovat tyypillisesti yleiskäyttöisiä sanoja kuten artikkelit, prepositiot ja pronominit, joiden esiintyvyys on suurta mutta semanttinen sisältö näkyy vähemmän. Stopword-suodatuksen tarkoituksena on vähentää melua, pienentää indeksiä ja nopeuttaa hakujen käsittelyä sekä parantaa keskittyneiden termien näkyvyyttä. Käytännön toteutus vaihtelee kielen ja sovelluksen mukaan; ei ole yhtä universaalia listausta, vaan listat ovat kielikohtaisia ja niitä voidaan räätälöidä.
Suomenkielisissä aineistoissa tyypillisiä stopsanoja ovat esimerkiksi ja, on, ei, tai, mutta, että, kun sekä se. Suomen
Nykyisissä hakujärjestelmissä stopsanat ovat yleisesti konfiguroitavissa: ne voidaan poistaa indeksoinnin aikana, kyselyn aikana tai sekä. On