IRsystemer
IRsystemer, eller informationsåtervinningssystem, är datorbaserade system som återfår relevanta dokument eller andra enheter från större samlingar som svar på en användares fråga. Målet är att maximera relevansen bland de presenterade resultaten och att sökprocessen ska vara snabb och skalbar i stora databaser eller på webben.
Ett typiskt IRsystem består av flera komponenter: en indexeringsmodul som bygger ett sökindex, ofta en inverterad
Data och representation: dokument lagras som text (och ibland multimodala data). Inverterad indexering gör det möjligt
Vanliga modeller: Boolean, vektorutrymme (bland annat cosinus-similarity), probabilistiska modeller som BM25, språkmodeller för IR samt neurala
Utvärdering och användning: IR-system utvärderas ofta med precision, recall, F1, mean average precision eller nDCG. Vanliga
Utmaningar och utveckling: skala, multimodala och flerspråkiga frågor, användarintention, relevansbedömning, snabbhet och användarpreferenser, samt integritets- och