märkningsmetoder
Märkningsmetoder är arbetsmetoder för att tilldela etiketter eller markörer till data eller fysiska objekt så att de kan organiseras, sökas och analyseras. De används inom lingvistik och NLP, bild- och videodata, ljud- eller medicinska register samt i tillverkning och kvalitetssäkring.
Vanliga typer är manuella märkningsmetoder där utbildade annotatörer tilldelar etiketter enligt en fastställd märkningsguide; semi-automatiska märkningsmetoder
Arbetsflödet inkluderar att definiera ett märkningsschema, utbilda annotatörer, märka data och genomföra kvalitetssäkring. Inter-annotator agreement används
Bedömning av märkningskvalitet sker ofta med reliabilitetsmått som Cohen's kappa eller Krippendorffs alfa, samt analys av
Användningsområden inkluderar byggande av NLP-modeller för tokenisering, ordklasser och namngivna entiteter, bild- eller videoannotering för objektdetektion,
Utmaningar inkluderar subjektivitet och begreppstvetydighet, behov av domänkunskap och konsekvent tillämpning av taxonomier samt annotatörers arbetsbelastning
Etik och standarder innebär skydd av integritet och rättvisa mot annotatörer, rimlig ersättning och transparent rapportering