Home

objektsigenkänning

Objektsigenkänning är en teknik inom datorseende som syftar till att identifiera vilka objekt som finns i en bild eller video samt att lokalisera dem i rummet. Målet är oftast att tilldela varje objekt en kategori och en position, ofta i form av bounding boxes eller pixelnivåmasker. Denna process används i allt från stillbildsanalys till flerdimensionell visionssensorer i realtid.

Inom området skiljer man mellan flera relaterade uppgifter. Klassificering avgör bildens övergripande innehåll utan att ange

Metoderna har utvecklats från traditionella datorseende tekniker med funktioner som SIFT och HOG till moderna djupa

Vanliga datamängder inkluderar COCO, PASCAL VOC och ImageNet. Utvärdering mäts MED hjälp av mAP (mean average

Utmaningar omfattar variationer i belysning och vy, occlusion, realtidsbehov, datasetbias och säkerhet. Utvecklingen fortsätter mot mer

objektens
plats.
Detektion
hittar
och
klassificerar
flera
objekt
samtidigt
och
ger
deras
positioner.
Segmentering
går
längre
och
producerar
exakta
maskor
som
avgränsar
varje
objekt
på
pixelnivå,
medan
spatiotemporal
igenkänning
hanterar
rörelse
och
förändringar
över
tid
i
video.
neurala
nätverk.
Arkitekturer
som
R-CNN,
Faster
R-CNN,
YOLO
och
SSD
används
för
effektiv
objektdetektion
medan
segmentering
kräver
modeller
som
Mask
R-CNN.
Träning
kräver
omfattande
märkt
data
och
ofta
transfer
learning
för
att
anpassa
modeller
till
nya
domäner.
precision),
IoU
(
Intersection
over
Union)
och
precision/recall.
Tillämpningar
sträcker
sig
över
övervakning,
fordonsseende,
industriell
automation,
medicinsk
bildanalys
och
robotik
samt
augmented
reality.
robusta
och
transparenta
system
som
kan
generalisera
bättre
över
olika
miljöer.