Unicodemerkkijonoja
Unicodemerkkijonoja ovat ohjelmistoissa käytettäviä merkkijonoja, jotka koostuvat Unicode-merkeistä. Unicode on maailmanlaajuinen standardi, jossa jokaiselle kirjoitusmerkille on määritelty ainutkertainen koodipiste. Merkkijonot voivat sisältää kielikohtaista tekstiä, erikoismerkkejä sekä symboli- ja emoji-merkit.
Merkintöjen tallennus tapahtuu eri koodauksilla. Yleisimmät ovat UTF-8, UTF-16 ja UTF-32. Koodipisteet voivat tarvita useamman tavun
Tekstin käsittelyssä on tärkeää erottaa koodipisteiden määrä ja grapheme-ryhmien muodostama visuaalinen merkki. Monet merkit koostuvat useista
Käytännön vaikutukset ovat muun muassa ohjelmointikielissä ja kirjastoversioissa. Monilla ympäristöillä merkkijonoja käsitellään koodiyksikkö- tai grapheme-tasolla, mikä
Esimerkki: merkkipisteet U+0041 (A), U+00E4 (ä) ja U+1F60A (tyytyväinen emoji) muodostavat erilaisia koostumia, jotka tallennetaan Unicode-merkkijonoina