vectorruimtemodel
Een vectorruimtemodel, in het Engels vaak aangeduid als vector space model, is een model voor informatieopvraging en tekstanalyse waarin documenten en queries worden voorgesteld als vectoren in een gemeenschappelijke ruimte. Elke dimensie komt overeen met een term uit de woordenschat en de waarde van een component geeft het gewicht van die term weer in het document of de query. Door representatie van documenten en queries als vectoren kunnen er vergelijkingen worden gemaakt op basis van inhoud.
Gewichten worden meestal bepaald met een combinatie van termfrequentie (TF) en inverse documentfrequentie (IDF), oftewel TF-IDF.
Bij een zoekopdracht wordt de queryvector vergeleken met alle documentvectoren en worden documenten gerangschikt op basis
Varianten en beperkingen: Latente Semantische Analyse (LSA) en verwante technieken reduceren de dimensionaliteit en proberen semantische