UTF8koodausta
UTF-8 on Unicode-merkistön koodausmuoto, jossa merkkijonot tallennetaan yhdestä neljään tavua per merkki. Se on ASCII-yhteensopiva: kaikista ASCII-merkkeistä ensimmäinen 128 koodipistettä sijoittuu samaan tavujärjestykseen.
Koodaus rakentuu muuttuvasta pituudesta: 1 tavun merkit ovat 0xxxxxxx (U+0000–U+007F), 2 tavun merkit 110xxxxx 10xxxxxx (U+0080–U+07FF),
Historia ja standardointi: UTF-8 kehitettiin 1990-luvulla Ken Thompsonin ja Rob Piken toimesta. Ensimmäinen yleinen versio julkaistiin
Käyttö ja yhteensopivuus: UTF-8 on webin de facto -merkistö ja laajasti käytössä tiedostoissa ja rajapinnoissa (JSON,
Vahva suositus: käytä UTF-8:aa kaikkialla ja varmista oikea koodaus sekä tiedoston että verkkoliikenteen metatiedoissa (esim. Content-Type: