Home

Objekterkennung

Objekterkennung ist ein Teilgebiet der Computer Vision, das darauf abzielt, Objekte in Bildern oder Videos zu identifizieren und ihre Lage zu bestimmen. Typischerweise umfasst sie sowohl die Bestimmung der Objektklasse als auch die Lokalisierung der Objekte durch Rahmen (Bounding boxes) oder, bei fortgeschrittenen Ansätzen, durch Masken. Neben reinen Detektionsaufgaben unterscheidet man auch Instanzsegmentierung, bei der jedes erkannte Objekt exakt segmentiert wird.

Historisch entwickelte sich die Objekterkennung von handwerklich extrahierten Merkmalen wie HOG, SIFT oder SURF in Verbindung

Die Qualität einer Objekterkennung wird häufig mit Metriken wie mittlerer precisions-ablauf (mAP) gemessen, basierend auf dem

Anwendungen finden sich in der Fahrzeugtechnik (Autonome Fahr- und Assistenzsysteme), Sicherheit und Überwachung, Robotik, industrielle Qualitätskontrollen

mit
klassischen
Klassifikatoren
zu
Deep-Learning-Ansätzen.
Moderne
Detektoren
wie
R-CNN,
Fast/
Faster
R-CNN
und
RetinaNet
arbeiten
oft
zweistufig
oder
ein-stufig
und
nutzen
Convolutional
Neural
Networks,
um
Merkmale
zu
lernen
und
Objekte
direkt
zu
lokalisieren.
Bekannte
ein-stopp-Detektoren
wie
YOLO
und
SSD
ermöglichen
schnelle
Inferenz,
was
sie
besonders
für
Echtzeitanwendungen
geeignet
macht.
Deep-Learning-Modelle
sind
heute
in
der
Regel
führend,
erfordern
aber
große
Datensätze
und
Rechenressourcen.
Schnittpunkt-über-Überlappungsmaß
(IoU)
zwischen
vorhergesagten
und
wahren
Boxen.
Gängige
Datensätze
sind
COCO,
PASCAL
VOC
und
ImageNet
DET.
sowie
medizinischer
Bildgebung.
Herausforderungen
umfassen
Realzeit-Anforderungen,
Occlusion,
Variationen
in
Beleuchtung,
Skalierung
und
domänenbezogene
Unterschiede.