Tekstihakumenetelmät
Tekstihakumenetelmät viittaavat erilaisiin tekniikoihin ja algoritmeihin, joita käytetään tekstidokumenttien etsimiseen ja noutamiseen tietokannasta tai kokoelmasta. Näiden menetelmien tavoitteena on löytää dokumentteja, jotka vastaavat käyttäjän antamaa kyselyä, joka voi olla joukko avainsanoja tai pidempi lause.
Yksinkertaisimmat tekstihakumenetelmät perustuvat avainsanojen täsmäytykseen. Ne etsivät dokumentteja, jotka sisältävät kaikki tai osa kyselyn sanoista. Tällaiset
Monimutkaisemmat menetelmät käyttävät erilaisia indeksointi- ja tiedonhakutekniikoita. Indeksointi luo tietorakenteen, joka nopeuttaa hakua. Esimerkiksi käänteinen indeksi
Suosittuja hakumenetelmiä ovat myös vektorimallit, kuten TF-IDF (Term Frequency-Inverse Document Frequency). TF-IDF antaa painoarvon sanoille sen