merkistökoodaukset
Merkistökoodaukset ovat järjestelmiä, joiden avulla teksti ja muut merkit voidaan tallentaa ja siirtää tietokoneen ja verkkopalveluiden välillä. Ne määrittävät, millä koodinumerolla kukin merkki esitetään ja miten binäärinen tallennus palauttaa alkuperäisen tekstin.
Historian alkuvaiheissa käytettiin 7-bittistä ASCII-koodausta, joka tuki noin 128 merkkiä. Tämä johti rajoituksiin ja tarpeeseen laajennuksille,
Unicode tarjoaa yhden yhtenäisen merkkikokoelman. Käytännössä Unicode toteutetaan useissa koodauksissa; suosituin on UTF-8, joka on ASCII-yhteensopiva
Endianness ja byte order mark (BOM) liittyvät erityisesti UTF-16- ja UTF-32-koodauksiin, koska järjestyksen vaihtelu vaikuttaa tallennetun
Merkistökoodaukset ovat keskeisiä monikielisessä nykypäivän tietoliikenteessä ja tietokannoissa: väärä koodaus voi aiheuttaa lukukelvottomia tekstejä ja tiedonsiirron