Kódpontok
Kódpontok, vagy Unicode-kódpontok, a karakterek numerikus azonosítói az Unicode szabványban. Minden karakterhez egyedi kódpoint tartozik, amely független attól, hogy azt milyen kódolási módon jelenítik meg vagy rögzítik a memóriában. A kódpontokat általában U+ hex formában jelölik. Például az 'A' a U+0041 kódponttal azonosítható, míg az eurójelet a U+20AC jelöli.
A kódpontok a 0x0000 és 0x10FFFF tartományban találhatók. A 0xD800–0xDFFF tartományt a UTF-16-ben surrogate párok jelölik,
Az Unicode kódpontok gyakorlati tárolását és cseréjét különböző encodings használják. A leggyakoribbak: UTF-8, UTF-16 és UTF-32.
A kódpontokról szóló gyakorlati megfontolások közé tartozik a normalizáció (NFC/NFD), a grapheme- és code-point-feldolgozás közötti különbség,