søgeindeksering
Søgeindeksering er processen med at oprette og vedligeholde et indeks, som gør det muligt hurtigt at finde relevant information i store samlinger af dokumenter. Det centrale begreb er inverteret indeks (inverteret indeks), hvor hvert unikt ord kortlægges til de dokumenter, hvor ordet forekommer, og ofte til positioner eller forekomster.
Processen indebærer typisk indsamling af dokumenter, forbehandling og tokenisering, fjernelse af stopord, normalisering (f.eks. lavere bogstav,
Ved forespørgsler bruges indekset til at identificere kandidatdokumenter og beregne relevans. Fleste systemer udnytter scoring-modeller som
Typer og implementeringer inkluderer fuldtekstindeksering, metadatindeksering og kombinationer heraf. Indekser kan være on-disk eller i hukommelsen,
Anvendelser omfatter søgemaskiner på nettet, interne virksomheds-søgeportaler, e-handelsplatforme og biblioteks- eller arkivsystemer. Effektiviteten afhænger af kvaliteten