frågevektorn
Frågevektorn är en representation av en sökfråga i ett högt dimensionellt termrum som används inom informationsåtervinning och naturlig språkbehandling. I en traditionell vektorbaserad modell motsvarar varje dimension ett ord i vokabulären, och värdet i dimensionen anger hur viktigt ordet är i frågan. Frågevektorn används för att jämföra frågan med dokument eller andra objekt som också representeras som vektorer i samma rum.
Byggandet sker oftast genom att först tokenisera frågan, ta bort stopwords och eventuellt normalisera orden. Därefter
Användning: Frågevektorn används för att ranka dokument genom att mäta likheten mellan frågevektorn och dokumentvektorer, oftast
Utmaningar: Traditionella bag-of-words-vektorer fångar oftast inte djup semantik och är känsliga för synonymer och polysemi. Hög