Tekstanotasjon
Tekstanotasjon er systemer og konvensjoner for å representere tekst og tekstdata i skriftlig form. Det omfatter tegnsett, transkripsjon, translitterasjon og markup som gir struktur, tegn- og presentasjonsinformasjon til tekster og språkdata. Notasjonen gjør det mulig å lagre, dele og analysere tekst på tvers av plattformer og språk.
Historisk utviklet notasjon seg fra trykt typografi til digitale encodings. ASCII var tidlig standard for enkel
Hovedområder inkluderer: tegnsett og koding (ASCII, Unicode, normalisering som NFC/NFD); fonetisk og fonemisk notasjon (IPA, SAMPA);
Bruksområder er brede: lingvistikken for transkripsjon og annotasjon, arkiv- og forskningsprosjekter som krever maskinlesbar tekstdatat, og
Utfordringer omfatter konvertering mellom encodings, karakterfeil (mojibake), behov for normalisering og tegnsstandardisering for å sikre konsistens