Home

objektdetektion

Objektdetektion är en central uppgift inom datorseende vars syfte är att hitta och klassificera förekomster av objekt av intresse i bilder eller videoströmmar samt ange deras exakta positioner. Resultatet består vanligen av ett antal bounding boxes, varje ruta kopplad till en klass och ofta en tillförlitlighetspoäng. Det skiljer sig från enklare objektklassificering, där hela bilden klassificeras, och från lokalisering utan klassificering.

Metoderna domineras av djupa neurala nätverk. Traditionellt följer det en tvåstegsstruktur där först regioner av intresse

Träning kräver stora, märkta dataset som COCO och PASCAL VOC. Annotationer innehåller vanligtvis varje föremåls klass,

Bedömning används mAP (mean Average Precision) vid olika IoU-trösklar för att mäta både klassificeringsnoggrannhet och lokaliseringsprecision.

Användningar sträcker sig från övervakning och trafikanalys till autonoma fordon, robotik, kvalitetskontroll i tillverkning samt bildsökning

Utmaningar inkluderar variation i belysning, occlusion, små objekt, snabba rörelser och krav på realtidsprestanda. Robustinhet mot

Framtiden pekar mot 3D-detektion från LIDAR eller stereo, videodetektion i realtid och bättre generalisering med mindre

övergenereras
och
sedan
klassificeras
och
lokaliseras;
tidigare
exempel
inkluderar
R-CNN,
Fast
R-CNN
och
Faster
R-CNN.
En
enstegsmodell
gör
det
i
ett
enda
skede,
exempelvis
YOLO
(You
Only
Look
Once)
och
SSD
(Single
Shot
Detector).
Nyare
metoder
fokuserar
på
förbättrad
noggrannhet
med
olika
förbättringar
som
anchor-free
strategier
och
förstärkta
nätverksdesigns
för
bättre
små
objekt.
bounding
box-koordinater
och
ibland
segmentation.
Modeller
förbereds
ofta
via
överföringsinlärning
från
bildklassificeringsnätverk.
IoU
mäter
överlappning
mellan
förutspådd
och
sann
bounding
box.
och
medieanalys.
dataskillnader
och
bias
samt
energi-
och
beräkningskrav
är
viktiga
forskningsområden.
märkta
data
genom
självinlärning
och
självövervakad
träning.