annotatörsavvikelser
Annotatörsavvikelser är variationer i hur olika annotatörer märker eller kategoriserar data, vilket leder till skillnader jämfört med en gemensam referens eller mellan annotatörer. Begreppet används ofta där konsensus och konsekvens är viktigt för maskininlärning, exempelvis inom natural language processing, bild- eller ljudannotering. Avvikelserna kan uppkomma i olika uppgifter och påverka dataets kvalitet och generaliserbarhet.
Vanliga typer inkluderar systematiska bias, slumpmässigt brus och tidsdrift. Systematiska bias uppstår när vissa annotatörer konsekvent
Mått och identifiering: Inter-annotator agreement (IAA) används tillsammans med mått som Cohen’s kappa eller Krippendorff’s alpha
Hantering: För att minska avvikelser används tydliga riktlinjer, träningsprogram och calibrationsövningar där annotatörer märker samma exempel
Betydelse: Hantering av annotatörsavvikelser ökar datasetets tillförlitlighet, modellprestanda och reproducerbarhet, särskilt inom medicinska eller juridiska tillämpningar