merkkikoodaukseen
Merkkikoodaus on järjestelmä, jonka avulla merkkijonot voidaan tallentaa ja siirtää bittijonona sekä palauttaa takaisin merkeiksi. Se yhdistää merkkijoukon ja koodausmuodon sekä tiedon siitä, miten merkit esitetään bitteinä. Yleisesti erotetaan kaksi käsitettä: merkkijoukko määrittelee, mitkä merkit ovat mahdollisia (esim. ASCII, ISO-8859-1, Unicode), kun taas merkkikoodaus määrittelee, miten nämä merkit koodataan bittijonona. Unicode on laajasti käytetty merkkijoukko, ja sen koodausmuotoja ovat UTF-8, UTF-16 ja UTF-32. ASCII on pienempi, 7-bittinen merkkijoukko, joka kuuluu Unicode-alueen alijoukkoon.
Koodauksessa merkit esitetään koodipisteinä, joita vastaa tavujono. Esimerkiksi UTF-8 on muuttuvapituinen: yksi–neljä tavua per merkki; ASCII-merkit
Käyttökonteksteja ovat verkkosivustot, sähköposti, tiedostot ja tietokannat. Ongelmia syntyy, kun järjestelmät käyttävät eri koodauksia, jolloin merkit