Merkintäprosesseissa
Merkintäprosesseissa tarkoitetaan organisoitua toimintaketjua, jossa data merkitään tai luokitellaan ennalta määriteltyjen luokkien, etikettien tai rakenteiden mukaan. Merkinnät voidaan kohdistaa tekstiin, kuviin, ääneen tai videoihin, ja ne muodostavat koulutus-, testaus- tai validointiaineistoja koneoppimis- ja tekoälysovelluksiin. Tavoitteena on tuottaa johdonmukainen ja läpinäkyvä merkintäjäsennys, jonka avulla järjestelmät voivat oppia tai tehdä päätöksiä luotettavasti.
Prosessin tyypilliset vaiheet ovat: ohjeistuksen laatiminen ja koulutus, datan keruu ja esikäsittely, annotaattorien rekrytointi ja koulutus,
Laadunvarmistus ja mittarit ovat keskeisiä. Yleisiä mittareita ovat inter-annotator agreementin taso ja virhemaatit, joita seurataan sekä
Käyttökohteet ulottuvat luonnollisen kielen käsittelystä ja tietokonenäöstä ääni- ja puheentunnistukseen, sekä erityisalojen datan annotointiin kuten lääketieteellisiin