MehrpersonenErkennung
MehrpersonenErkennung bezeichnet die Aufgabe der Computer vision, mehrere Personen in einem einzelnen Bild oder Video zu erkennen, ihre Positionen zu lokalisieren und, falls erforderlich, ihre Identitäten über die Zeit hinweg zu verfolgen. Sie umfasst in der Regel die Detektion von Personen durch Begrenzungsrahmen oder Segmentierungen sowie die Zuordnung dieser Personen über aufeinander folgende Frames.
Moderne Ansätze basieren überwiegend auf tiefen neuronalen Netzen. Für die Detektion kommen Systeme wie Faster R-CNN,
Daten und Evaluierung: gängige Datensätze umfassen COCO, CrowdHuman oder MOT-Challenges, die sowohl Detektion als auch Tracking
Anwendungen: MehrpersonenErkennung wird in Sicherheits- und Überwachungssystemen, zur Analyse von Menschenmengen, in Sport- und Veranstaltungsanalysen sowie
Herausforderungen: Zu den zentralen Problemen zählen starke Occlusion, dichte Menschenansammlungen, Maßstabsunterschiede, Echtzeit-Anforderungen sowie Datenschutz- und Fairness-Bedenken.