otsingusüsteemid
Otsingusüsteemid on tarkvarasüsteemid, mille eesmärk on leida ja esitada kasutaja päringule sobivaid dokumente või andmeid suurtest kogudest. Peamised komponendid on uss (web crawler), inverteeritud indeks, päringu töötlus ja reitingu mehhanismid ning kasutajaliides, mis kuvab tulemused. Uss kogub materjali veebist ja teistest allikatest; indeks struktureerib selle teabe sõnade ja metaandmete alusel. Päringu töötlus sisaldab märksõnade eraldamist, õigekirja parandust ning vajadusel lemmatiseerimist ja sünonüümide käsitlemist. Reitingu mudelid hindavad dokumendi relevantsust päringuga; levinud meetodid on TF-IDF, BM25 ning keeleneutraalsed ja kontekstipõhised mudelid, mis võivad kasutada klikkimisandmeid ja muid signaale.
Otsingusüsteeme eristatakse kasutusala järgi: veebiotsingud, mis hõlmavad miljoneid dokumente, ning ettevõtte- või saidiotsing, mis keskendub struktureeritud