UTF8merkistöä
UTF-8-merkistöä on Unicode-merkistön muuttuvapituinen koodaus, joka on suunniteltu sekä tehokkaaksi että ASCII-yhteensopivaksi. UTF-8 otettiin laajasti käyttöön 1990-luvulla; sen kehitti Rob Pike ja Ken Thompson Bell Labsissä. Standardointi on edistynyt useissa RFC-dokumenteissa, joista keskeisin on RFC 3629 (2003).
Merkinnässä yksittäinen Unicode-merkki koodataan 1–4 tavun pituisina jonoina. Ensimmäinen tavu kertoo, kuinka monta tavua merkki koostuu:
Ominaisuudet ja vaikutukset: UTF-8 on ASCII-yhteensopiva, joten vanha ASCII on suoraan kelvollinen UTF-8-merkistössä. Koska kyse on
Käyttö: UTF-8 on nykyisin Internetin ja monien ohjelmistojen oletusmerkistö sekä suosittu valinta Unicode-merkkien tallentamiseen ja siirtämiseen.