Postingslisten
Postingslisten (Singular: Postingsliste) sind eine zentrale Datenstruktur in der Information Retrieval. Für jedes Suchwort wird eine Liste von Fundstellen geführt, die angibt, in welchen Dokumenten dieses Wort vorkommt. Postingslisten bilden das Gegenstück zum Wörterbuch und bilden den Kern eines invertierten Index, der Anfragen effizient beantwortet.
Ein Eintrag in einer Postingsliste, ein Posting, enthält typischerweise eine Dokumentenkennung. Häufig werden zusätzlich die Termhäufigkeit
Es gibt Varianten: Postingslisten mit Positionsdaten (positional postings) und Listen ohne Positionsdaten. Im invertierten Index werden
Speicher- und Leistungsaspekte: Große Listen werden komprimiert gespeichert. Typische Techniken sind Lückenkodierung (Gap Encoding), variable-byte Coding
Historischer Kontext: Die Idee eines invertierten Index stammt aus der Informationsbeschaffung und der IR-Forschung; Postingslisten ermöglichen