UTF8tiedostoissa
UTF8tiedostoissa tarkoitetaan tiedostoja, joiden sisältö on koodattu UTF-8-merkistöllä. UTF-8 on Unicode-merkistöjen muuttuvapituinen koodaus, jossa kunkin merkin esitys vaihtelee yhdestä neljään tavua. Ensimmäiset 128 merkkiä vastaa ASCII-taulukkoa, joten UTF-8 on ASCII-yhteensopiva ja laajasti tuettu eri alustoilla ja ohjelmistoissa.
Tiedostojen käytössä UTF-8:n suurin etu on kattavuus: kaikki Unicode-merkit voidaan edustaa samalla koodauksella, ja koodaus ei
Tiedoston alussa voi esiintyä Byte Order Mark (BOM). UTF-8:n BOM on 0xEF, 0xBB, 0xBF. BOM on vapaaehtoinen,
Haasteita ovat väärin tai puutteellisesti ilmoitettu koodaus sekä mojibake eli virheellisesti tulkitut merkit, kun tiedosto avataan