hakujärjestelmät
Hakujärjestelmät ovat alustoja, joiden tehtävänä on löytää ja palauttaa käyttäjän hakukyselyn perusteella relevantteja dokumentteja tai tiedonpaloja suurista tiedonlähteistä. Ne voivat hakea tekstiä, kuvia, videoita tai strukturoitua dataa eri sovellusalueilla.
Keskeiset komponentit ovat käyttöliittymä, kyselyprosessorit, indeksointi- ja hakualgoritmit sekä rankkaus- ja palautusmallit. Inverted index -tiedostomuoto tallentaa
Tyypillisesti hakujärjestelmiä ovat yleiset web-hakukoneet, yrityshakusovellukset, kirjastojen hakukatalogit sekä yritysten sisäiset hakupalvelut. Monissa järjestelmissä tarjotaan myös
Hakuprosessi sisältää monivaiheisen sanastoinnin ja tilastollisen etenemisen: tokenisointi, stemming- tai lemmatisointi, stop wordien poistaminen sekä synonyymien
Arvioinnissa käytetään mittareita kuten tarkkuus, kattavuus, MAP ja NDCG sekä käyttäjäperusteista A/B-testaamista. Hakujärjestelmät suunnitellaan usein kestämään