Unicodekodningarna

Unicodekodningarna är metoderna som används för att representera Unicode-kodpunkter som sekvenser av bytes så att text kan lagras och överföras mellan olika system. De mest använda är UTF-8, UTF-16 och UTF-32. Dessa kodningar gör det möjligt att entydigt koda och avkoda varje tecken när rätt tolkning används.

UTF-8 är en variabellängdskodning där ett tecken består av mellan en och fyra bytes. Den är bakåtkompatibel

UTF-16 använder tvåbytesenheter och kan även använda fyra bytes för tecken utanför BMP via surrogater. Den

UTF-32 är en enkel, fast längds-kodning där varje tecken representeras av fyra bytes. Den är lätt att

Historiskt finns det även mindre använda eller föråldrade kodningar som UTF-7 och UTF-EBCDIC. Den nuvarande rekommendationen

i

operativsystem.

självsynkroniserande

teckenordningar,

i

Windows-miljöer

i

programmeringsspråk.

minneskrävande

representationsform

i

kompatibilitet,