Unicodemerkkejä
Unicodemerkkejä ovat Unicode-standardiin kuuluvia merkejä, joille on varattu yksilöllinen koodipiste. Unicode on maailmanlaajuinen standardi tekstin tallentamiseen ja siirtämiseen, jonka tarkoituksena on yhdistää erilaiset kirjoitusjärjestelmät, symbolit ja emoji samaan merkkijärjestelmään ja taata yhteensopivuus eri laitteiden välillä.
Merkkejä hallitaan koodipisteillä, joiden arvoja merkitään muodossa U+XXXX. Koodipisteiden kokonaismäärä ulottuu U+0000–U+10FFFF, ja ne jaetaan useisiin
Merkkejä voidaan tallentaa eri encodauksilla, kuten UTF-8, UTF-16 ja UTF-32. UTF-8 on yleisin verkossa; se käyttää
Käytössä on Unicode-normalisointi, joka sisältää muodot NFC, NFD, NFKC ja NFKD. Normalisointi varmistaa, että erilaisten merkkijonojen
Unicode kattaa käytännössä kaikki nykyiset kirjoitusjärjestelmät sekä tarvittavat symbolit ja emoji. Sen käyttö ulottuu ohjelmoinnista verkkosivuille