Vektorsuchsysteme
Vektorsuchsysteme sind Informationsgewinnungssysteme, die Dokumente, Abfragen oder andere Daten durch hochdimensionale Vektorrepräsentationen beschreiben. Im Gegensatz zu traditionellen Keyword-basierten Suchmaschinen ermöglichen sie die semantische Ähnlichkeitssuche, bei der ähnliche Bedeutungen auch bei unterschiedlicher Formulierung gefunden werden können.
Funktionsweise: Zunächst werden Inhalte mithilfe von Embedding-Modellen in Vektoren überführt. Ein Index speichert diese Vektoren zusammen
Typische Datenformen: Texte, Bilder, Ton, Tabellen oder Code werden in Vektoren überführt. Embeddings können vortrainiert oder
Indizes und Implementierungen: Es gibt exakte Suchmethoden sowie ANN-Indexe wie hierarchische Navigable Small World (HNSW), Inverted
Anwendungen: Semantische Suche in Wissenstexten, Frage-Antwort-Systeme, Multimodale Suche, Empfehlungssysteme, Code-Suche und Inhaltserkennung.
Herausforderungen: Abbildung der Semantik hängt stark von der Embedding-Qualität ab; hohe Speicherkosten, Indexpflege, Aktualität der Daten;
---