Home

gegevensretrieval

Gegevensretrieval is het proces van het opvragen en terugvinden van relevante gegevens uit een informatiesysteem of verzameling gegevensdragers. Het gaat doorgaans om het formuleren van een query, het doorzoeken van indexen of databases en het presenteren van resultaten die overeenkomen met de informatiebehoefte van de gebruiker. Gegevensretrieval kan zowel betrekking hebben op gestructureerde als ongestructureerde data.

Gegevens kunnen bestaan uit gestructureerde bronnen zoals relationele databases en NoSQL-gegevensopslag, semi-gestructureerde data zoals JSON of

Veelgebruikte technologieën zijn querytalen als SQL en SPARQL, en zoekmotoren zoals Elasticsearch of Apache Solr. Naast

Retrieval-processen omvatten queryformulering, data-extractie, indexing, matching en ranking, evenals filtering op basis van metadata of facetten.

Toepassingsgebieden zijn onder meer bedrijfs- en intranetzoekportalen, digitale bibliotheken, e-commercezoekfuncties, medische informatiesystemen en wetenschappelijke databanken. Evaluatie

XML,
en
ongestructureerde
content
zoals
documenten,
berichten
of
multimedia.
Voor
het
zoeken
wordt
vaak
gebruikgemaakt
van
indexeringen,
zoals
inverted
indexes,
en
van
ranking-algoritmen
die
de
waarschijnlijkheid
van
relevantie
bepalen.
traditionele
boolean-
en
vector-space
benaderingen
kunnen
systemen
ook
probabilistische
modellen
of
neurale
representaties
gebruiken
om
semantische
verwantschap
te
benutten.
De
ontwikkeling
van
gegevensretrieval
omvat
aandacht
voor
snelheid,
schaalbaarheid,
data-kwaliteit
en
veiligheid.
van
prestaties
vindt
vaak
plaats
met
maatstaven
als
precisie,
recall,
F1-score
en
metriek
zoals
MAP
of
NDCG.