Home

bildklassificering

Bildklassificering är en uppgift inom datorseende där ett algoritmsystem tilldelar en eller flera etiketter till en bild baserat på dess innehåll. Uppgiften kan vara enkel, som att skilja mellan katt och hund, eller mer komplex, till exempel att känna igen flera objekt och deras relationer i en scen. Den används inom medicinsk bildanalys, övervakning, transport och konsumentelektronik.

Typiska arbetsflöden börjar med insamling och märkning av bilddata, följt av förbehandling, modellträning och utvärdering. Supervised

Historiskt användes handgjorda funktioner som SIFT och HOG tillsammans med maskininlärning innan djupinlärning tog över. På

Single-label och multi-label klassificering är vanliga varianter; vissa uppgifter kräver finare, hierarkisk eller granskad klassifikation. Bedömning

Tillämpningar finns inom sjukvård, industriell kvalitetssäkring, jordbruk och contentmoderation. Viktiga överväganden är dataskydd, etisk användning, och

learning
dominerar:
modellen
lär
sig
från
bildetiketter
som
människor
tillhandahåller.
Liten
data
kan
kompenseras
med
dataaugmentation
eller
genom
transfer
learning,
där
en
modell
förbehandlas
på
stora
dataset
och
anpassas
till
en
mindre
uppsättning
etiketter.
2010-talet
blev
konvolutionella
neurala
nätverk
(CNN)
standard
för
bildklassificering.
Föregångare
som
AlexNet,
VGG
och
senare
ResNet,
Inception
och
EfficientNet
har
drivit
mycket
av
fältets
utveckling.
Transfer
learning
och
pretränade
modeller
på
ImageNet
används
ofta
för
att
snabbt
uppnå
bra
resultat
på
nya
domäner.
baseras
på
mått
som
noggrannhet,
precision,
recall,
F1
och
konfusionmatrix.
Utmaningar
inkluderar
bias
och
inkonsekventa
etiketter,
överfitting
vid
små
dataset,
tolkningsbarhet
och
robusthet
mot
adversarial
försök.
transparens
i
hur
modellen
når
sina
beslut,
särskilt
i
kritiska
sammanhang
som
diagnostik
eller
rättsliga
beslut.