Home

relevansrangering

Relevansrangering er prosessen der søkeresultater eller anbefalinger ordnes og presenteres i en prioritert rekkefølge basert på hvor relevante de antas å være for brukerens forespørsel eller kontekst. Hovedmålet er å gjøre det mest nyttige innholdet synlig først, slik at brukeren raskt finner ønsket informasjon.

Tradisjonelle metoder bygger på vurderinger av dokumentenes innhold og query-dokument-sammenheng. Vanlige teknikker inkluderer termbaserte modeller som

Læringsbaserte tilnærminger, eller learning-to-rank, kombinerer flere rangeringselementer og trenes på data som typisk består av brukerinteraksjoner

Evaluering av relevansrangering skjer både offline og online, ved bruk av metrikker som NDCG, MAP, presisjon

tf-idf
og
BM25,
samt
vektorrom-modeller
der
dokumenter
og
spørringer
representeres
som
vektorer.
BM25
er
en
av
de
mest
utbredte
rankingfunksjonene,
som
vektlegger
rimelighet
av
forekomster
og
dokumentets
langvarighet.
Nyere
systemer
bruker
også
distribuert
representasjoner
(embeddings)
for
å
måle
semantisk
likhet
mellom
spørsmål
og
dokumenter.
(klikk,
avvisninger)
eller
manuelt
merket
relevans.
Modeller
som
LambdaMART
og
nevrale
rerankere
kan
bruke
omfattende
funksjonsköer
fra
tekst,
metadata
og
atferd.
Funksjoner
inkluderer
tekststikkord,
kontekst,
tidsaspekt
og
brukerprofil.
ved
k,
og
A/B-testing.
Bruksområder
inkluderer
søkemotorer,
nettbutikker,
digitale
biblioteker
og
FAQ-systemer.
Utfordringer
inkluderer
balanse
mellom
relevans
og
mangfold,
ferskhet,
personvern
og
systematisk
skjevhet
i
data.