sisällönhaku
Sisällönhaku tarkoittaa prosessia, jossa käyttäjän hakukysely kohdistetaan digitaaliseen sisältöön ja järjestelmä palauttaa relevantit osumat. Siihen kuuluu sisällön indeksointi, kyselyjen käsittely, relevanssin lajittelu sekä tulosten esittäminen. Sisällönhaku esiintyy muun muassa verkkopalveluissa, kirjasto- ja arkistopalveluissa sekä yritysten intranet- ja dokumenttirekistereissä.
Toimintaperiaate: Indeksointi kerää sisällön ja luo hakurakenteen, joka tukee sekä täyden tekstin että metadata-hakua. Suomen kielelle
Relevanssi määritellään yleensä ranking-funktioilla kuten BM25, mutta nykyaikaisissa ratkaisuissa käytetään myös vektoripohjaisia malleja, jotka huomioivat sanaston
Ongelmat ja sovellukset: Sisällönhaku on keskeinen osa kirjasto-, julkaisujärjestelmä- ja verkkopalveluiden käyttökokemusta, mutta haastaa kielen morfologia,
Esimerkkejä työkaluista: Elasticsearch, Apache Solr sekä perinteiset täyden tekstin haun mahdollistavat järjestelmät.