Home

Indexieren

Indexieren bezeichnet in der Informationstechnik den Prozess der Erstellung eines Index, einer Datenstruktur, die den Zugriff auf Datensätze beschleunigt. Ein Index dient dazu, Suchanfragen schneller zu erfüllen, indem er die Suche auf eine Teilmenge relevanter Datensätze einschränkt, statt alle Datensätze einer Sammlung zu durchsuchen. Indizes werden in verschiedenen Kontexten eingesetzt, insbesondere in relationalen Datenbanken, Volltextsuchmaschinen und Bibliothekskatalogen.

In relationalen Datenbanken sind Indizes strukturierte Datenstrukturen wie B- oder B+-Bäume oder Hash-Indizes. Sie ermöglichen es,

Bei der Volltextindizierung entsteht ein Inverted Index, der jedes vorkommende Wort mit den Dokumenten verknüpft, in

Anwendungsbereiche reichen von Datenbanksystemen über Suchmaschinen bis hin zu digitalen Bibliotheken. Die Indizierung erfordert eine Balance

Werte
eines
oder
mehrerer
Spalten
zügig
auf
die
dazugehörigen
Datensätze
abzubilden.
Dadurch
vermeiden
Datenbanken
einen
vollständigen
Tabellenscan
und
beschleunigen
Operationen
wie
SELECT
mit
WHERE,
JOIN
oder
ORDER
BY.
Indizes
verursachen
zusätzlichen
Speicherbedarf
und
können
die
Schreibleistung
mindern,
da
Änderungen
in
Tabellen
auch
die
Indizes
aktualisieren
müssen.
denen
es
auftritt.
Typische
Vorverarbeitungsschritte
umfassen
Tokenisierung,
Normalisierung,
Entfernen
von
Stoppwörtern
und
Stemming
oder
Lemmatisierung.
Der
Index
enthält
meist
Postingslisten
mit
Positionsinformationen,
wodurch
Suchanfragen
wie
Phrasen
oder
Nähe-Abfragen
effizient
bearbeitet
werden
können.
zwischen
Suchgeschwindigkeit,
Speicherbedarf,
Aktualisierungskosten
und
Konsistenz.
Modernes
Indexieren
umfasst
auch
inkrementelle
Indizierung,
Komprimierungstechniken
und
verteilte
Indizes
für
große,
skalierbare
Systeme.