Codepunkte
Codepunkte sind die numerischen Repräsentationen einzelner Zeichen im Unicode-Zeichensatz. Sie dienen als abstrakte Identifikatoren, unabhängig von der konkreten Speicherung oder Darstellung. Ein Codepunkt wird üblicherweise in der Form U+hhhh geschrieben, wobei hhhh eine hexadezimale Zahl ist. Mehrere Codepunkte können zusammen ein visuell zusammengesetztes Zeichen bilden, etwa bei Akzentkombinationen oder Emoji-Sequenzen.
Der gültige Bereich reicht von U+0000 bis U+10FFFF. Teile dieses Bereichs sind reserviert oder unzugewiesen. Die
Zur Speicherung von Codepunkten werden Encodings verwendet, insbesondere UTF-8, UTF-16 und UTF-32. Diese Codierungen unterscheiden sich
Codepunkte lassen sich in Programmiersprachen oft durch Escape-Sequenzen darstellen, z. B. U+0041 für das Zeichen A
Für Textverarbeitung und Verarbeitungssysteme sind Codepunkte grundlegend: sie ermöglichen Identifikation, Sortierung, Normalisierung (NFC/NFD) und korrektes Rendering