kielimerkintäjärjestelmistä
Kielimerkintäjärjestelmät, tunnetaan myös koodinimellä "language tagging systems", ovat tapoja tunnistaa ja merkitä tekstien tai puheen kieli. Niiden päätarkoitus on mahdollistaa automaattinen kielentunnistus, jolla on lukuisia sovelluksia digitaalisessa maailmassa. Yksinkertaisimmillaan kielimerkintä voi olla yksi merkki tai lyhenne, joka edustaa tiettyä kieltä. Esimerkiksi ISO 639 -standardi määrittelee kaksikirjaimisia (esim. fi suomelle) tai kolmikirjaimisia (esim. fin suomelle) koodeja kielten yksiselitteiseen tunnistamiseen.
Näitä järjestelmiä käytetään laajasti verkkosivuilla, tiedostoissa ja tietokannoissa. Verkkosivuilla kielimerkintä auttaa hakukoneita indeksoimaan sisältöä oikein ja
Automaattinen kielentunnistus perustuu usein tilastollisiin menetelmiin ja koneoppimiseen. Järjestelmät analysoivat tekstin tyypillisiä kirjainyhdistelmiä, sanoja ja lauserakenteita,