koodipisteet
Koodipisteet ovat abstrakteja numeroarvoja, joilla merkit ja symbolit identifioidaan tietojärjestelmissä. Unicode-standardeissa koodipiste on kokonaisluku, joka määrittää merkkiä U+-notation kanssa, esimerkkinä U+0041 vastaa latinalaista A:aa. Kaikki mahdolliset koodipisteet muodostavat alueen U+0000–U+10FFFF.
Koodipisteet kuvaavat merkin sijaan sen identiteetin. Ne eivät itsessään määrää, miltä merkki näkyy, vaan käyttövarat riippuvat
Käytännössä koodipisteet tallennetaan erilaisiin merkkikoodauksiin. Yleisimmät ovat UTF-8, UTF-16 ja UTF-32. UTF-8 käyttää yhden neljään tavua
Koodipisteet esiintyvät usein U+-etuliitteellä, ja ne voivat ilmetä ohjelmointikielissä esimerkiksi escape-sekvensseinä kuten \uXXXX tai \UXXXXXXXX. Ne