ngramindexering
N-gramindexering är en teknik inom textsökning som används för att stödja snabb substringsökning i stora textkorpus genom att indexera alla n-gram, det vill säga substrings av längd n, som förekommer i dokumenten. Denna metod gör det möjligt att hitta dokument som innehåller en given sekvens av tecken även om exakta ord skiljer sig något eller ordningen varierar.
Hur det fungerar: man väljer ett värde på n och extraherar för varje dokument alla n-gram med
Frågebehandling och urval: när en användare lämnar en fråga genereras n-gram av frågan och relevanta dokument
Fördelar och begränsningar: fördelen är snabb substringsökning och stöd för viss felmarginal i söktermer. begränsningar inkluderar