Home

multietichetta

Multietichetta è il termine usato in informatica per descrivere la classificazione multi-etichetta, in cui un singolo esempio può essere assegnato a più etichette tra un insieme prefissato. Si distingue dalla classificazione multiclass, in cui ogni esempio ha una sola etichetta. Il concetto è comune in ambiti come elaborazione del linguaggio naturale, visione artificiale, etichettatura di immagini e annotazione di dati, e vale per dati strutturati e non strutturati.

Le principali tecniche si dividono in due gruppi. Le trasformazioni del problema includono binary relevance (una

Le metriche comuni includono la perdita di Hamming, l’accuratezza di sottoinsieme (exact match) e misure di

classificazione
per
etichetta)
e
powerset
(trattare
ogni
combinazione
di
etichette
come
una
classe).
Le
tecniche
di
adattamento
estendono
modelli
esistenti
(alberi,
SVM,
reti
neurali)
a
output
multi-etichetta,
usando
probabilità
per
etichetta
o
funzioni
di
perdita
multi-label.
Nelle
reti
profonde
si
impone
l’uso
di
attivazione
sigmoid
per
ogni
etichetta
e
di
una
perdita
binary
cross-entropy
o
di
ranking.
precisione,
richiamo
e
F1
calcolate
per
etichetta
o
tramite
micro-
e
macro-averaging.
Le
applicazioni
tipiche
includono
etichettatura
di
immagini
e
video,
categorizzazione
testuale,
tagging
musicale
e
annotazione
di
dati
biomedici.
Le
principali
sfide
sono
lo
squilibrio
delle
etichette,
la
dipendenza
tra
etichette,
il
rumore
di
etichettatura
e
problemi
di
scalabilità
quando
aumenta
il
numero
di
etichette.