vectorruimtemodel - Infinite Lexicon - Infinite Lexicon

vectorruimtemodel

Een vectorruimtemodel, in het Engels vaak aangeduid als vector space model, is een model voor informatieopvraging en tekstanalyse waarin documenten en queries worden voorgesteld als vectoren in een gemeenschappelijke ruimte. Elke dimensie komt overeen met een term uit de woordenschat en de waarde van een component geeft het gewicht van die term weer in het document of de query. Door representatie van documenten en queries als vectoren kunnen er vergelijkingen worden gemaakt op basis van inhoud.

Gewichten worden meestal bepaald met een combinatie van termfrequentie (TF) en inverse documentfrequentie (IDF), oftewel TF-IDF.

Bij een zoekopdracht wordt de queryvector vergeleken met alle documentvectoren en worden documenten gerangschikt op basis

Varianten en beperkingen: Latente Semantische Analyse (LSA) en verwante technieken reduceren de dimensionaliteit en proberen semantische

documentvectoren

relevantiescore.

vectorberekeningen

hoog-dimensionaal

vectorruimtemodel

informatieopvraging