Home

Unicodestandarden

Unicodestandarden är en internationell standard som beskriver hur tecken från olika skrivsystem kodas, behandlas och manipuleras i datorer och mjukvara. Den syftar till att skapa en gemensam, universell uppsättning kodpunkter och regler för att stödja text i alla språk och skriftsystem, samt för att underlätta utbyte av text mellan olika plattformar och program.

Grundläggande i standarden är Unicode, ett teckenkodningssystem som tilldelar varje tecken en unik kodpunkt, vanligtvis skrivs

Standarden underhålls av Unicode Consortium och är i praktiken harmoniserad med ISO/IEC 10646, så att Unicode

Encodingformat som används är UTF-8, UTF-16 och UTF-32. UTF-8 är en variabel längd-kodning som är bakåtkompatibel

Normering och sortering är centrala delar av standarden. Normaliseringsformerna NFC, NFD, NFKC och NFKD gör tecken

som
U+XXXX.
Det
omfattar
tecken
från
många
språk,
symboler,
emoji
och
historiska
tecken.
Tecken
är
indelade
i
teckenplaner;
Basic
Multilingual
Plane
täcker
U+0000
till
U+FFFF
och
övriga
planer
används
för
historiska,
supplementära
och
specialtecken.
och
ISO‑standarden
motsvarar
samma
uppsättning
tecken.
Nyutgåvor
tillför
nya
tecken
och
uppdaterar
egenskaper;
uppdateringar
kommer
kontinuerligt.
med
ASCII
och
dominerar
på
webb
och
i
filer.
UTF-16
används
i
flera
operativsystem
och
programmeringsmiljöer,
medan
UTF-32
är
en
fast
längd
men
används
sällan
i
praktiken.
jämförbara
och
konsekventa
när
de
kombinerar
tecken.
Unicode
Collation
Algorithm
(UCA)
styr
hur
tecken
ordnas
i
sortering.
Rendering
och
fontstöd
är
avgörande
för
att
tecknen
visas
korrekt,
särskilt
för
komplexa
tecken
och
emoji.