Home

canonicaliseren

Canonicaliseren of canonicalisering is het proces waarbij data of objecten worden omgezet naar een gestandaardiseerde, uniforme representatie. Het doel is dat twee items die volgens een vast criterium gelijkwaardig zijn, eenduidig identificeerbaar blijven. Door canonicalisatie kunnen opslag, matching, indexering en validatie efficiënter en betrouwbaarder verlopen.

Toepassingsgebieden zijn onder meer informatietechnologie, data management, bestandsbeheer en zoektechnologie. In web- en beveiligingscontexten spelen canonicalisatie

Veelgebruikte methoden zijn normalisatie, standaardisering, sortering, case-folding en het berekenen van hashes van de canonical vorm.

Uitdagingen en afwegingen omvatten het kiezen van passende criteria, omgaan met veranderende standaarden en de kosten

en
deterministische
representaties
een
cruciale
rol:
URL-
en
tekstopmaak,
en
Unicode-tekstenormalisatie.
In
XML-gebaseerde
systemen
is
canonicalisatie
(C14n)
essentieel
voor
veilige
digitale
handtekeningen,
omdat
ze
een
unieke
byte-representatie
afdwingt.
Voorbeelden:
bij
URLs
kan
meerdere
schrijfwijzen
naar
dezelfde
resource
verwijzen;
de
canonical
URL
omvat
meestal
een
uniforme
hoofdlettergebruik,
consistente
padstructuur
en
constante
percent-encoding.
Voor
XML
wordt
door
canonicalisatie
een
vaste
volgorde
van
elementen
en
attributen
vastgelegd
zodat
de
digitale
handtekening
consistent
blijft.
In
tekstverwerking
zorgt
Unicode-normalisatie
ervoor
dat
tekens
en
bepaalde
tekencombinaties
eenduidig
worden
behandeld.
in
tijd
en
rekensnelheid.
Een
verkeerde
of
onduidelijke
canonicalisatie
kan
leiden
tot
informatieverlies
of
verkeerde
interpretatie.
Het
is
daarom
belangrijk
om
een
duidelijke
definitie
van
equivalentie
te
hanteren
die
past
bij
de
beoogde
toepassing
en
om
de
canonicalisatie
up-to-date
te
houden.