RetrievalsModelle
RetrievalsModelle sind formale Rahmungen in der Informationsbeschaffung, die dazu dienen, aus einer großen Sammlung relevanten Dokumenten zu einer gegebenen Suchanfrage vorzuwählen. Sie definieren die Repräsentation von Abfrage und Dokumenten, eine Ranking-Funktion und Kriterien zur Evaluation. Ziel ist es, relevante Dokumente effizient zu identifizieren und möglichst brauchbare Suchergebnisse zu liefern.
Klassische Modelle beruhen vor allem auf lexikalischem Matching. Der Vector-Space-Ansatz nutzt Termhäufigkeiten wie TF-IDF und misst
Wahrscheinlichkeitsbasierte Modelle ordnen der Relevanz Wahrscheinlichkeiten zu. Bekannte Ansätze sind BM25, das Frequenzen, Dokumentlängen und Smoothing
Neurale und hybride Ansätze gewinnen an Bedeutung. Dense Retrieval verwendet neuronale Netze, um flache Vektorrepräsentationen von
Evaluation erfolgt mit Metriken wie Precision, Recall, Mean Average Precision (MAP) und Normalized Discounted Cumulative Gain