Home

teckenkoder

Teckenkoder är system som beskriver hur tecken kan representeras som digital data. En teckenkod anger hur varje tecken i en textmängd översätts till en sekvens av bytes som kan lagras och överföras. Denna översättning kallas ofta en teckenmappning mellan tecken och bytes. Det finns olika teckenuppsättningar och olika sätt att koda dem i bytes.

En teckenkod skiljer mellan teckenuppsättning och hur tecknen kodas som bytes. En teckenuppsättning innehåller vilka tecken

Vanliga teckenkoder inkluderar ASCII (7-bitars, enkel teckenuppsättning som används som bas i många senare standarder), ISO

Praktiska frågor kring teckenkoder innefattar felaktiga kodningar eller blandningar som leder till mojibake, där text visas

Sammanfattningsvis är teckenkoder centrala för hur textRepresenteras och tolkas i datorer, nätverk och programvara, och val

som
kan
representeras,
medan
själva
koden
anger
vilka
bytevärden
som
används
för
varje
tecken.
Vissa
koder
är
fasta
i
längd
(ett
tecken
motsvaras
alltid
av
ett
specifikt
antal
bytes),
medan
andra
är
variabel
i
längd.
8859-1
och
Windows-1252
(8-bitars
utvidgningar),
samt
Unicode-baserade
encodings
som
UTF-8,
UTF-16
och
UTF-32.
Unicode
syftar
till
att
stödja
alla
skript
och
symboler
och
används
i
allt
fler
system
och
applikationer.
UTF-8
är
den
mest
spridda
på
webben
eftersom
den
är
variabel
i
längd
och
bakåtkompatibel
med
ASCII;
varje
tecken
kan
kodas
med
mellan
1
och
4
bytes.
felaktigt.
Det
är
viktigt
att
specificera
rätt
charset
i
filer,
överföringsprotokoll
och
databaser,
samt
vara
medveten
om
frågor
som
endianness
och
användning
av
Byte
Order
Mark
i
UTF-16
och
UTF-32.
av
encoding
påverkar
både
lagring,
överföring
och
visning
av
text.