Indexeren
Indexeren is het proces van het maken en onderhouden van indexen die de vindbaarheid van documenten, records of data verbeteren. Het wordt toegepast in bibliotheek- en informatiebeheer, databases en zoekmachines. Het doel is om gebruikers snel relevante informatie te laten vinden zonder de gehele dataset te hoeven doorzoeken. Een centrale techniek in informatie-indexering is het inverted index: voor elke term wordt bijgehouden in welke documenten die term voorkomt. Daarnaast bestaan forward indexes die per document de aanwezige termen opsommen. Deze indexen maken snelle zoekoperaties mogelijk, vooral bij grote verzamelingen.
Het indexeren omvat doorgaans een voorbehandelingsstap: tekst wordt getokeniseerd in afzonderlijke termen, normaal gemaakt (bijvoorbeeld kleine
Indexeringsprocessen kunnen incrementeel plaatsvinden, waarbij nieuwe of gewijzigde documenten aan de index worden toegevoegd zonder volledig
Indexeren kent trade-offs: uitgebreidere indexen verbeteren zoeksnelheid maar vergen opslagruimte en brengen onderhoudskosten met zich mee.