kodpunkter - Infinite Lexicon - Infinite Lexicon

kodpunkter

Kodpunkt (code point) är den numeriska identifieraren som Unicode tilldelar varje tecken. Det är en abstrakt enhet som existerar oberoende av hur tecknet renderas, vilken font som används eller hur texten kodas. Kodpunkter används för att beskriva vilka tecken som finns i ett teckensystem, från bokstäver och siffror till symboler och emoji.

Inom Unicode beskrivas kodpunkter med notationen U+ följt av hexadecimala siffror, till exempel U+0041 för bokstaven

Det är viktigt att skilja mellan kodpunkter och tecken som visas. I text kan flera kodpunkter bilda

För lagring och överföring används olika teckenkodningar. UTF-8 kodar varje kodpunkt i mellan en och fyra bytes,

I praktiken används kodpunkter för referens i standarder och programmering. Hantering av text innebär ofta att

A

kodpunktsrymden

i

i

16-bitarsenheter

i

U+D800–U+DFFF