Unicodenormalisointiin
Unicodenormalisointi (Unicode normalization) on Unicode-tekstiä koskeva prosessi, jolla merkkijono muutetaan vakioituun muotoon, jotta saman merkkijonon eri esitykset voidaan tunnistaa ja käsitellä luotettavasti. Normalisointi huomioi kanoniset yhdistämiskelat sekä yhteensopivuustunnisteet, mikä helpottaa merkkijonojen vertailua, hakua ja tallennusta.
Neljä yleistä normaalimuotoa on määritelty: NFC (Normalization Form C), NFD (Normalization Form D), NFKC ja NFKD.
Normalisointi on keskeinen osa tekstinkäsittelyä: se mahdollistaa luotettavan merkkijonojen vertailun, hakemisen ja indeksoinnin riippumatta siitä, miten
Normalisointi ei yleensä vaikuta tekstin semanttiseen merkitykseen, vaan sen esitykseen. Se on olennaista yhteensopivuuden ja rakenteellisen