Codepunkte - Infinite Lexicon - Infinite Lexicon

Codepunkte

Codepunkte sind die numerischen Repräsentationen einzelner Zeichen im Unicode-Zeichensatz. Sie dienen als abstrakte Identifikatoren, unabhängig von der konkreten Speicherung oder Darstellung. Ein Codepunkt wird üblicherweise in der Form U+hhhh geschrieben, wobei hhhh eine hexadezimale Zahl ist. Mehrere Codepunkte können zusammen ein visuell zusammengesetztes Zeichen bilden, etwa bei Akzentkombinationen oder Emoji-Sequenzen.

Der gültige Bereich reicht von U+0000 bis U+10FFFF. Teile dieses Bereichs sind reserviert oder unzugewiesen. Die

Zur Speicherung von Codepunkten werden Encodings verwendet, insbesondere UTF-8, UTF-16 und UTF-32. Diese Codierungen unterscheiden sich

Codepunkte lassen sich in Programmiersprachen oft durch Escape-Sequenzen darstellen, z. B. U+0041 für das Zeichen A

Für Textverarbeitung und Verarbeitungssysteme sind Codepunkte grundlegend: sie ermöglichen Identifikation, Sortierung, Normalisierung (NFC/NFD) und korrektes Rendering

ausschließlich

Nichtzugewiesene

nicht-zugeordnete

Nicht-Charaktere

Byte-Darstellung,

zugrundeliegenden

unterschiedliche