annotálása
Annotálása (annotáció) olyan folyamat, amely során adatokhoz jelöléseket vagy megjegyzéseket adunk annak érdekében, hogy tartalmi, strukturális vagy szemantikai információt rögzítsünk. Szöveges adatoknál például morfológiai, lemmatizációs, szintaktikai vagy szemantikai annotációt végeznek; képeknél objektum-dobozokat vagy pixel-szintű szegmentációt, hang- és videóadatoknál pedig beszéd-transkriptumok, időbélyegek és eseménytípusok kerülhetnek hozzá.
Az annotálás céljai közé tartozik a természetes nyelvi feldolgozás (NLP) számára készített adathalmazok előkészítése, kereső- és
A folyamat gyakran kikényszeríti világos útmutatók kidolgozását, pilotot és annotátorok közötti egyezőség mérését (IAA) valamint adjudikációt.
Eszközök és formátumok közé tartoznak például a BRAT, WebAnno, INCEpTION és Prodigy típusú annotációs rendszerek; adatformátumokként
Kihívások közé tartozik a szubjektivitás és a kontextusfüggés, az annotálási egységesség és skálázás kérdései, valamint az