Gestenerkennung
Gestenerkennung bezeichnet den Prozess der automatischen Identifikation menschlicher Gesten aus sensorgestützten Daten. Typische Quellen sind Kameras (2D-Bilder), Tiefenkameras, Inertialsensoren wie Beschleunigungs- und Gyrosensoren sowie elektromyographische Signale (EMG). Ziel ist es, aus den erfassten Signalen semantische Informationen abzuleiten, etwa Handzeichen oder dynamische Bewegungen, die als Befehle für Computer, Robotik oder Fahrzeuge dienen.
Gesten lassen sich in statische Gesten und dynamische Bewegungen unterteilen. Vision-basierte Ansätze nutzen Bild- oder Tiefeninformationen,
Methodisch kommen klassische Merkmalsextraktion (HOG, Optical Flow) plus klassische Klassifikatoren wie SVM oder Random Forest zum
Anwendungsfelder umfassen Mensch-Computer-Interaktion, Virtual Reality, Gaming, Fahrzeugbedienung und Robotik. Sign Language Recognition gehört dazu, ebenso berührungslose
Zu den Herausforderungen zählen große Variabilität zwischen Nutzern, verschiedene Blickwinkel, Beleuchtung, Hintergrundrauschen, Occlusion sowie Anforderungen an
In der Forschung werden oft große multimodale Datensätze genutzt. Zukunftstrends umfassen robustere, benutzerunabhängige Modelle, Edge-Computing für