Zeichenverarbeitung
Zeichenverarbeitung bezeichnet die Gesamtheit der Verfahren und Technologien zur Verarbeitung von Textdaten in Computern. Sie umfasst Zeichenkodierung, Speicherung, Verarbeitung, Darstellung, Eingabe, Suche, Formatierung sowie Lokalisierung.
Zeichenkodierung ist die Grundlage der Zeichenrepräsentation. Unicode dient als Standard, mit Kodierungen wie UTF-8 und UTF-16.
In der Software-Entwicklung umfasst die Zeichenverarbeitung das Arbeiten mit Zeichenketten, Suchen, Ersetzen, Tokenisierung, Normalisierung, Groß-/Kleinschreibung und
Die Darstellung und das Layout von Texten beachten Schriftarten, Glyphen, Zeichenformen sowie Rendering und Shaping, insbesondere
Eingabe und Internationalisierung umfassen Tastaturnutzung, Eingabemethoden (IME) und die Verarbeitung von Rechts-nach-Links-Sprachen. Anpassung an Locale, Datums-
Standards und Werkzeuge umfassen Unicode-Standards, ISO/IEC 10646, die ICU-Bibliothek, Shaping-Engines, Texteditoren, Datenbanken und Typesetting-Programme.
Anwendungen und Herausforderungen: Textverarbeitung findet sich in Betriebssystemen, Textverarbeitungsprogrammen, Suchmaschinen und Webdiensten. Herausforderungen sind Grapheme-Grenzen, Normalisierungsformen,