Fulltekstindekser
Fulltekstindekser er datastrukturer som gjør det mulig å søke raskt i store tekstsamlinger. De bygger opp et indeksdimensjon hvor ord eller tokens fra dokumentene peker til de dokumentene der de forekommer, ofte sammen med posisjoner og annen metadata. Hensikten er å gjøre raske tekstbaserte søk mulig, snarere enn å skanne hele samlingen ved hvert søk.
Den vanligste typen fulltekstindeks er den omvendte indeks (inverted index). Den omfatter en ordliste (term-lexicon) og
Indekseringsprosessen består av forbehandling av tekst: oppdeling i tokens, normalisering (f.eks. lowercasing), stamming eller lemmatisering, og
Ved søk tolkes spørsmålet ofte som en liste av termer og eventuelle operatorer. Søkemotorer støtter frasjesøk,
Vedlikehold av indekser inkluderer innsetting av nye dokumenter, oppdateringer og fjerning av eksisterende. Inkrementell indeksering og