Unicodekodningar
Unicodekodningar refererar till metoderna för att representera Unicode-kodpunkter som sekvenser av bytes. En kodpunkt är en specifik teckenposition inom Unicode, till exempel U+0041 för bokstaven A. En kodning beskriver hur denna kodpunkt mappas till bytes och hur sekvenser av bytes kan tolkas som tecken. Unicode och ISO/IEC 10646 ger en gemensam uppsättning kodpunkter, vanligtvis kallad Unicode, medan själva lagringen i filer eller över nätverk sker genom olika kodningar.
De tre dominerande Unicode-kodningarna är UTF-8, UTF-16 och UTF-32. UTF-8 är en variabel längd-kodning som använder
UTF-32 lagrar varje kodpunkt som exakt fyra bytes, vilket gör beräkningar och indexering enkla men ofta ineffektivt
Andra aspekter att känna till är att rätt kodning måste deklareras i metadata eller HTTP-huvuden; felaktig