Unicodetecken
Unicodetecken bezeichnet die im Unicode-Standard definierte Gesamtheit der Zeichen, Symbole und Steuerzeichen, die in Computersystemen zur Repräsentation von Text verwendet werden. Ziel ist eine universelle Zeichendarstellung, die Sprachen, Schriftarten und Plattformen plattformübergreifend miteinander verbindet. Dazu gehören Buchstaben, Ziffern, Interpunktionszeichen, mathematische Symbole sowie Emoji und andere grafische Zeichen.
Der Unicode-Standard wurde in den frühen 1990er Jahren entwickelt, um die Vielzahl lokaler Zeichensätze zu vereinheitlichen.
Um Text in Speichersystemen abzubilden, werden verschiedene Codierungen verwendet. Die wichtigsten sind UTF-8 (variabler Byte-Längen-Codierung, kompatibel
Fortgeschrittene Aspekte betreffen Grapheme, Normalisierung und Textverarbeitung. Grapheme bilden sichtbare Zeichen aus mehreren Codepunkten; Normalisierung sorgt
Unicode ist heute Grundlage der meisten modernen Betriebssysteme, Programmiersprachen und Webstandards. Trotz der breiten Unterstützung bleiben