Käsittelemättömiätermillä
Käsittelemättömiä termejä ovat termit tai ilmaisumuodot, joita ei ole vielä läpikäyty organisaation sanastojen, luokitusten tai tiedonhallintajärjestelmien käsittelyvaiheissa. Ne voivat tulla teksteistä, rekistereistä tai tiedostoista ja sisältää kirjoitusvirheitä, taivutettuja muotoja, lainasanoja sekä variantteja. Käsittelemättömät termit eivät vielä viittaa yksiselitteisesti oikeaan käsitteeseen, eivätkä siksi sovi suoraan luokituksiin tai hakuoperaatioihin.
Käytännössä käsittelemättömiä termejä esiintyy tiedonhallinnan prosesseissa, kuten tiedonkeruussa, arkistoinnissa tai hakukantaan indeksoitaessa. Niiden tunnistaminen ja tallennus
Käsittelyvaiheet voivat sisältää virheiden korjaamisen ja normalisoinnin, termien yksikertaistamisen (canonicalization), taivuttamattomien ja monikertojen hallinnan, kielentunnistuksen sekä
Käsittelemättömien termien hallinta vaikuttaa tiedon löydettävyyteen ja käytettävyyteen. Haasteisiin kuuluvat epäjohdonmukaisuus, moni- tai monikielisyys, alaan erityiset