tiedonhakutekniikka
Tiedonhakutekniikka on tietotekniikan ala, joka keskittyy löytämään käyttäjän kyselyn perusteella olennaista tietoa suurista kokoelmista. Se kattaa sekä tiedon keräämisen ja tallentamisen että hakukäyttöliittymien ja tulosten järjestämisen, jotta käyttäjä löytää haluamansa tiedot nopeasti ja tehokkaasti.
Keskeistä on datakokoelman indeksoinnin, kyselyn käsittelyn ja palautusmenetelmien yhdistelmä. Indeksoinnissa tuotetaan hakukoneen käyttämä indeksi, usein inverted
Hakumallit voidaan jakaa boolean-perusteisiin ja ranking-pohjaisiin malleihin. Ranking-mallit käyttävät termien painotusta (esim. TF-IDF) tai tilastolähtöisiä malleja
Lisämenetelmät voivat sisältää kyselyn laajentamisen, relevanssipohjaisen palautteen, automaattisen sanastoinnin ja NLP-tekniikoita, joiden avulla tunnistetaan synonyymit sekä
Kokonaisuuden arviointi tapahtuu mittareilla kuten tarkkuus, kattavuus sekä F-mittaus, ja laajemmissa järjestelmissä MAP ja NDCG. Arviointi