Home

Segmentierungsnetzwerke

Segmentierungsnetzwerke sind neuronale Netze, die darauf trainiert werden, jedem Pixel eines Eingabebildes eine Klasse zuzuordnen. Sie werden primär für semantische Segmentierung eingesetzt, bei der Pixel zu Objektklassen gehören, sowie für Instanz- und panoptische Segmentierung. Ziel ist es, die Bildinhalte räumlich sauber abzubilden und Objekte in der Szene zu trennen oder zu gruppieren.

Architektur: Üblich ist ein Encoder-Decoder-Ansatz. Der Encoder extrahiert Merkmalskarten, der Decoder erzeugt eine Pixel-Label-Map. Skip-Verbindungen helfen,

Training: Praktisch alle Segmentierungsnetze werden überwacht trainiert, d.h. es liegen pixelweise Labels vor. Verlustfunktionen umfassen Kreuzentropie,

Bekannte Architekturen: FCN (Fully Convolutional Network), U-Net, SegNet; DeepLab-Varianten (DeepLabv2/v3/v3+), PSPNet. Für Instanzsegmentierung kommt Mask R-CNN

Anwendungen und Bewertung: Segmentierungsnetze finden Einsatz in der medizinischen Bildgebung, autonomem Fahren, Fernerkundung, Landwirtschaft und industrieller

Herausforderungen: Benötigen erhebliche annotierte Datenmengen, sind rechnerisch teuer, leiden unter Domänenverschiebung, Klassenungleichgewicht und Randunschärfe. Optimierung, Beschleunigung,

räumliche
Details
zu
bewahren.
Moderne
Varianten
verwenden
dilatierte
Faltungen,
ASPP
oder
mehrstufige
Kontextverarbeitung,
um
Informationen
über
verschiedene
Skalen
zu
integrieren.
Dice-Koeffizient
oder
deren
Mischungen.
Datenaugmentation,
Pretraining
auf
großen
Datensätzen
und
Feinabstimmung
auf
domänenspezifische
Daten
verbessern
Robustheit
und
Generalisierung.
zum
Einsatz.
Es
existieren
auch
speziell
optimierte
Modelle
für
medizinische
Bilder
oder
Satellitenaufnahmen.
Inspektion.
Leistungsbeurteilung
erfolgt
oft
über
IoU
(Intersections
over
Union)
bzw.
mittlere
IoU
(mIoU)
und
Pixelgenauigkeit;
Dice-Koeffizient
ist
eine
weitere
gängige
Metrik.
Speichereffizienz
und
robuste
Generalisierung
bleiben
zentrale
Forschungsfelder.