Home

dataindexering

Dataindexering is het proces waarbij aanvullende datastructuren worden gemaakt om snelle toegang tot gegevens mogelijk te maken. Doel is het terugvinden van rijen of documenten zonder door hele tabellen of bestanden te hoeven bladeren. Indexen worden veel toegepast in databases, zoekmachines en dataopslagsystemen en kunnen de uitvoering van queries aanzienlijk versnellen.

Er bestaan verschillende soorten indexen. In relationele databases zijn veelgebruikte indexen B-trees of varianten daarvan, met

Werking en kosten: een index bevat sleutelwaarden en verwijzingen naar de bijbehorende gegevens. De query-optimizer kan

Best practices en overwegingen: indexeer gericht op kolommen die vaak in where-, join- of order-by-clausules voorkomen

onderscheid
tussen
clustering
en
niet-clustering
(welk
type
volgorde
de
fysieke
opslag
bepaalt).
Composite
of
multicolumn
indexen
koppelen
meerdere
kolommen
aan
één
index.
Voor
tekstzoekopdrachten
zijn
inverted
indexes
gangbaar:
ze
koppelen
zoektermen
aan
de
documenten
waarin
ze
voorkomen.
Geospatiale
queries
maken
vaak
gebruik
van
R-tree-
of
vergelijkbare
indexen.
In
NoSQL-
en
search-achtige
systemen
spelen
ook
speciale
indexen
een
rol
die
afgestemd
zijn
op
de
opslag-
en
zoekpatronen
van
die
systemen.
een
index
kiezen
als
deze
sneller
is
dan
een
volledige
scan.
Indexen
verbeteren
leesoperaties
maar
brengen
extra
opslagruimte
en
overhead
met
zich
mee
bij
schrijven,
bijwerken
en
verwijderen.
Regelmatig
onderhoud,
zoals
herindexering
of
reorganisatie,
kan
nodig
zijn
om
fragmentatie
te
beperken.
en
met
voldoende
selectiviteit.
Vermijd
overmatige
indexering,
omdat
dit
de
schrijftijd
en
het
opslaggebruik
verhoogt.
Gebruik
statische
statistieken
en
queryplannen
om
de
juiste
typen
en
combinaties
van
indexen
te
kiezen.