charsettunniste
Charsettunniste on tiedon tunniste, joka kertoo käytettävän merkkijärjestelmän, eli miten bytes tulkitaan merkeiksi. Charsettunnisteen avulla ohjelmat voivat riippumatta ympäristöstä tulkita ja esittää tekstiä oikein sekä siirtää tietoa järjestelmästä toiseen.
Charsettunnisteet ovat standardoituja IANA-merkistörekisterissä. Yleisimpiä ovat UTF-8, ISO-8859-1 (Latin-1), Windows-1252 ja UTF-16. UTF-8 on laajasti käytössä
Käyttö ja käytännöt: charsettunniste voidaan ilmoittaa HTTP-otsikossa esimerkiksi Content-Type: text/html; charset=UTF-8, HTML-dokumentin meta-tunnisteessa <meta charset="UTF-8"> sekä
Haasteet ja huomioitavat seikat: nimeämiskäytännöt voivat poiketa eri järjestelmissä (esim. UTF-8 vs. utf8 -aliasit), UTF-16:ssa voi