Unicodenormalisoinnissa
Unicodenormalisoinnissa on prosessi, jolla varmistetaan, että tekstiä edustetaan yhdenmukaisesti Unicode-merkistössä. Unicodeen sisältyy useita tapoja esittää samoja merkkejä. Esimerkiksi yhden kirjaimen, kuten "é", voi esittää yhtenä koodipisteenä tai yhdistelmänä perusmerkistä "e" ja yhdistävänä akuuttiaksenttimerkistä. Tämä voi johtaa ongelmiin, kun tekstiä verrataan tai etsitään, koska kaksi näennäisesti identtistä merkkijonoa voivat olla teknisesti erilaisia.
Normalisointi ratkaisee tämän muuntamalla eri esitykset standardoiduksi muotoon. Unicode määrittelee neljä pääasiallista normalisointimuotoa: NFD (Normalization Form
NFC ja NFD ovat yleisimpiä muotoja, ja niitä suositellaan useimpiin käyttötarkoituksiin, kuten tiedostojen tallentamiseen ja tekstin