Home

Datarepresentasjon

Datarepresentasjon er måten informasjon blir kodet, lagret og overført mellom systemer og applikasjoner. Den beskriver hvordan fenomener i verden omgjøres til tegn, tall og strukturer som maskiner og mennesker kan bearbeide. En fullstendig forståelse krever at man skiller mellom fysisk representasjon (hvordan data faktisk lagres i minne og på disk som sekvenser av biter), logisk representasjon (datatype og datastrukturer), og semantisk representasjon (meningen og konteksten til dataene).

På lavt nivå brukes bits og bytes, ofte med forskjellige baser og endianness. Hovedtypen representasjon for

Data kan også presenteres i ulike formater for lagring og overføring. Eksempler på strukturerte formater inkluderer

Bevisst valg av representasjon påvirker ytelse, presisjon, kompatibilitet og brukervennlighet. Datamodeller og skjemadefinisjoner (for eksempel datatyper

Datarepresentasjon er sentralt i mange felt, inkludert datavarehus, maskinlæring og nettverk. Riktig representasjon letter effektiv lagring,

tall
er
binær,
der
heltall
vanligvis
lagres
i
to-komplement
og
flyttallsverdier
i
IEEE
754-standarder.
Dette
påvirker
nøyaktighet
og
aritmetiske
operasjoner.
Tegn
og
tekst
benytter
tegnkodinger
som
ASCII
eller
Unicode
(for
eksempel
UTF-8),
som
bestemmer
hvordan
sekvenser
av
biter
kobles
til
tegn.
JSON,
XML
og
CSV,
mens
binary-formater
som
Parquet,
Protobuf
og
Avro
ofte
brukes
i
stordata-sammenhenger.
Når
data
sendes
over
nettverk
eller
mellom
systemer,
kan
ekstra
koding
som
Base64
brukes
for
å
sikre
kompatibilitet
i
tekstbaserte
kanaler.
og
relasjoner
i
databaser)
styrer
hvordan
dataene
innhentes,
valideres
og
konverteres
mellom
forskjellige
formater.
Konvertering
mellom
representasjoner
kan
innebære
avrunding,
tap
av
presisjon
ved
komprimering
eller
koding,
og
behov
for
normalisering
og
validering.
rask
analyse
og
pålitelig
utveksling
mellom
systemer,
samtidig
som
det
begrenser
risikoen
for
feil
som
følge
av
misforståtte
eller
tapte
data.