objektlokalisering
Objektlokalisering är uppgiften att hitta platsen för objekt av intresse i bilder eller videoströmmar och att ange deras positioner. I praktiken innebär det vanligtvis att för varje objekt returneras en bounding box som omger objektet, samt en klassetikett och ofta ett tillhörande tillförlitlighetsvärde (confidence score). Lokalisering i sig fokuserar på var objekten finns; när den kombineras med klassificering kallas uppgiften ofta objektdetektion.
Inom fältet skiljer man mellan gränsboxbaserad lokalisering och mer detaljerad semantisk eller instanslokalisering. Gränsboxbaserade metoder anger
Vanliga metoder inkluderar regionbaserade nätverk som R-CNN-familjen (R-CNN, Fast R-CNN, Faster R-CNN) samt end-to-end-modeller som YOLO
Utvärdering av objektlokalisering bygger på mått som IoU (Intersection over Union) mellan den predicerade boxen och
Användningsområden inkluderar autonoma fordon, övervakning, robotik och augumented reality. Utmaningar är occlusion, variation i skala och