visionteknik
Visionteknik, eller datorseende, är ett område inom informationsteknik som syftar till att få maskiner att tolka och förstå visuell information från omvärlden. Området kombinerar bildbehandling, maskininlärning och robotik för att extrahera meningsfull information ur bilder och videoströmmar.
Systemen bygger på sensorer som kameror, LiDAR och djupsensorer, samt mjukvara för bildbehandling, mönsterigenkänning och inlärning.
Vanliga uppgifter inkluderar bildklassificering, objekt- och scenigenkänning, semantisk och instance-segmentering, spårning, djupuppskattning, 3D-rekonstruktion och optisk teckenigenkänning.
Värdering sker med vanliga datamängder och mått såsom noggrannhet, precision, recall, F1, mAP och IoU. Utmaningar
Historia: Visionteknik har sina rötter i tidig bildanalys på 1960- och 1970-talet och växte kraftfullt med tillämpningar