kodenheter
Kodenheter er de grunnleggende enhetene i en tekst når den er lagret med en bestemt tegnkodering. De er de minste elementene som kan behandles av encodingen, og størrelsen varierer mellom ulike kodinger. For eksempel består et enkelt Unicode-tegn ofte av én til fire kodeenheter i UTF-8, mens UTF-16 bruker én eller to kodeenheter per tegn. Et kodepunkt er den abstrakte Unicode-verdien som tegnet representerer, og er uavhengig av hvordan det er kodet. Derfor kan lengden til en streng måles i antall kodeenheter eller i antall kodepunkter, avhengig av konteksten.
En viktig distinksjon er mellom kodepunkter, kodeenheter og grapheme-kluster. Et kodepunkt er en Unicode-verdi som representerer
Praktisk innebærer kodenheter at lagring, overføring og behandling av tekst kan variere i effektivitet og riktighet.