UTF8enkoodausta
UTF8enkoodausta tarkoittaa Unicode-merkistöjen esittämistä UTF-8-koodauksella. UTF-8 on muuttuvapituinen enkoodaus, joka kattaa koko Unicode-merkistön U+0000–U+10FFFF. Sen kehittivät Rob Pike ja Ken Thompson 1990-luvulla, ja siitä tuli laajalti käytetty osa Unicode-standardeja. UTF-8 on ASCII-yhteensopiva: U+0000–U+007F-merkit esitetään yhdellä tavulla samalla koodipainolla kuin ASCII.
Teknisesti UTF-8 käyttää 1–4 tavua per merkki. Yksittäinen ASCII-merkki säilyy samalla tavulla. Kaksitavuiset merkit ovat U+0080–U+07FF;
Edut ovat ASCII-aloitus, ei endianness -ongelmia, sekä itsesynkronoituvuus: merkkien alku voidaan löytää etsimällä johtavat tavut. UTF-8
Käytännön huomioita ovat oikea merkistöilmoitus: tiedoston tai verkko-otsikoiden koodaus on ilmoitettava esimerkiksi Content-Type-otsikossa tai HTML-dokumentissa meta-elementissä;