objektsigenkänning

Objektsigenkänning är en teknik inom datorseende som syftar till att identifiera vilka objekt som finns i en bild eller video samt att lokalisera dem i rummet. Målet är oftast att tilldela varje objekt en kategori och en position, ofta i form av bounding boxes eller pixelnivåmasker. Denna process används i allt från stillbildsanalys till flerdimensionell visionssensorer i realtid.

Inom området skiljer man mellan flera relaterade uppgifter. Klassificering avgör bildens övergripande innehåll utan att ange

Metoderna har utvecklats från traditionella datorseende tekniker med funktioner som SIFT och HOG till moderna djupa

Vanliga datamängder inkluderar COCO, PASCAL VOC och ImageNet. Utvärdering mäts MED hjälp av mAP (mean average

Utmaningar omfattar variationer i belysning och vy, occlusion, realtidsbehov, datasetbias och säkerhet. Utvecklingen fortsätter mot mer

i

objektdetektion

(

precision/recall.