Unicodenormalizáció
Unicodenormalizáció är processen att omvandla olika representationer av samma tecken eller teckensekvenser i Unicode till en enda standardiserad form. Detta är viktigt för att säkerställa att textdata kan jämföras och bearbetas korrekt, oavsett hur den ursprungligen kodades. Utan normalisering kan texter som ser identiska ut för en mänsklig läsare skilja sig åt på en byte-nivå, vilket kan leda till fel vid sökning, sortering och jämförelse.
Det finns flera olika normaliseringsformer definierade av Unicode-standarden. De vanligaste är NFD (Normalization Form Canonical Decomposition)
Utöver dessa finns även NFKD och NFKC, som använder kompatibilitetsersättning. Kompatibilitetsersättning hanterar tecken som har liknande