tiedonannota
Tiedonannota, eli tiedonannotointi, on prosessi jossa data merkitään tai varustetaan käsitteellisillä tunnisteilla ja metadataan, jotta koneoppimismallit sekä data-analyysit voivat oppia ja toimia sen perusteella. Tavoitteena on muuttaa raakadata käyttökelpoiseksi opetustarkoituksiin, laadunvalvontaan ja automaattiseen päätöksentekoon.
Prosessi etenee usein suunnitelmallisesti: kerätään dataa, laaditaan annotointiohjeet ja koodisto sekä määritellään annotaattorit ja laadunvarmistusmenetelmät. Annotaatio
Tyypillisiä annotaatiotyyppejä ovat kuvat: esim. luokat, rajaajat (bounding boxes) tai segmentointi; teksti: nimialueet, tunnisteet, sentimentti; ääni
Haasteita ovat annotaatiovirheiden hallinta, lajien ja kulttuurin aiheuttama偏差, työntekijöiden riittävä koulutus sekä yksityisyys- ja turvallisuusnäkökohdat. Laadunvarmistus,