IRsystemen
IRsystemen zijn softwaretoepassingen die uit grote documentenverzamelingen relevante informatie terugvinden op basis van een gebruikersquery. Ze combineren technieken uit informatiemanagement, taalkunde en statistiek en worden toegepast in zoekmachines, digitale bibliotheken, intranetsystemen en contentmanagementsystemen.
Belangrijke onderdelen zijn een documentenverzameling, een indexeringskern of omgekeerde index, een query-verwerkingsmodule en een rangschikkingscomponent, plus
Veel gebruikte retrieval-modellen zijn onder meer het boolean-model, het vector-ruimte-model met termgewichten (bijv. TF-IDF), probabilistische modellen
Evaluatie van IRsystemen gebeurt met metrics zoals precisie, recall en F1, en meer geavanceerde maten zoals
Toepassingen omvatten webzoekmachines, enterprise search, digitale bibliotheken en e-commerce-zoekfunctionaliteit. Belangrijke uitdagingen zijn schaalbaarheid en latency, omgaan