RetrievalSysteme
RetrievalSysteme sind Software- oder Dienstsysteme, die aus großen Sammlungen relevanten Inhalt für eine gegebene Benutzereingabe identifizieren. Sie finden Dokumente, Webseiten oder andere Informationsobjekte anhand eines Such- oder Abfragevorgangs und liefern eine geordnete Trefferliste. Typische Einsatzgebiete sind Websuche, Intranet- oder Enterprise-Suchen sowie digitale Bibliotheken. Kernaufgaben sind Abfrageanalyse, Dokumentenretrieval, Ranking und die Präsentation der Ergebnisse.
Die Leistung von RetrievalSystemen basiert auf einem Index, häufig einem invertierten Index, der Begriffe mit Dokumenten
Für die Bewertung der Relevanz kommen verschiedene Modelle zum Einsatz. Traditionelle Ansätze verwenden den Vektorraum (TF-IDF)
Anwendung, Evaluation und Herausforderungen
RetrievalSysteme finden breite Anwendungen in Suchmaschinen, Unternehmens- oder Forschungsumgebungen. Typische Herausforderungen sind Skalierbarkeit, Mehrsprachigkeit, Unstrukturiertheit der