Home

tekstreeksen

Tekstreeksen zijn opeenvolgende tekens die samen een stuk tekst voorstellen. In informatica worden ze vaak strings genoemd en vormen ze een basiseenheid voor opslaan, verwerken en weergeven van tekst in software en databases.

In computergeheugen kunnen tekstreeksen op verschillende manieren worden opgeslagen. Ze bestaan uit codepunten, die in het

Veelvoorkomende bewerkingen: lengte berekenen, substring ophalen, concatenatie, zoeken en vervangen, splitsen op scheidingstekens, samenvoegen, trimming van

Toepassingen en overwegingen: tekstverwerking, invoer/uitvoer, bestands- en netwerkberichten, en lokalisatie. Programmeeromgevingen bieden bibliotheken voor Unicode-compatibele verwerking.

Tekstreeksen vormen een fundamenteel concept in zowel informatica als taalkunde en vormen de ruggengraat van vrijwel

geheugen
kunnen
worden
verpakt
als
bytes
of
als
getallen.
In
Unicode
kunnen
dezelfde
tekstreeksen
op
verschillende
manieren
worden
gecodeerd,
bijvoorbeeld
UTF-8
of
UTF-16.
Omdat
Unicode-codepunten
combinaties
van
tekens
kunnen
bevatten,
betekent
dit
dat
de
lengte
van
een
tekstreeks
in
tekens
kan
afwijken
van
de
lengte
in
bytes.
Bij
vergelijking
en
sortering
wordt
vaak
gewerkt
met
normalisatie:
NFC
en
NFD.
whitespace,
en
hoofdletter-conversies.
In
veel
talen
zijn
tekstreeksen
immuun
tegen
verandering
(immutable);
in
anderen
kunnen
ze
worden
aangepast
op
plaats.
Bij
representatie
wordt
ook
gesproken
over
grapheme
clusters
als
gebruikers-perceptie
van
een
teken
verschilt
van
een
enkele
codepunt.
Belangrijke
aandachtspunten
zijn
encodingfouten,
normalisatie
bij
vergelijking,
locale-gevoelige
sortering,
en
beveiliging
tegen
injectie
bij
het
verwerken
van
tekst
uit
onbetrouwbare
bronnen.
elke
software
die
met
tekst
werkt.