Home

sprekeridentificatie

Sprekeridentificatie is een tak van stem- en spreekbiometrie die zich bezighoudt met het vaststellen van de identiteit van de spreker uit een audio-opname, uit een vooraf gedefinieerde lijst sprekers of uit een grotere populatie. In tegenstelling tot sprekerverificatie, waarbij een stem wordt vergeleken met een specifieke persoon, probeert identificatie te achterhalen wie er in de opname heeft gesproken zonder een directe identiteit te geven. Toepassingen bevinden zich onder meer in forensische analyse, beveiliging en authenticatie, en in mediadomeinen waar het determineren van de spreker vereist is.

Het proces omvat doorgaans voorbewerking van audio, segmentatie en extractie van stemkenmerken zoals MFCC's, toonhoogte en

Uitdagingen zijn onder meer variaties in opnamekwaliteit, ruis en kanaal-effecten, spreeksnelheid, emotie en context. Het systeem

timbre.
Deze
kenmerken
worden
gemodelleerd
met
technieken
als
GMM-UBM,
i-vector/PLDA
en
moderne
diepe
leer-embeddings
zoals
x-vectors,
waarna
de
onbekende
opname
wordt
vergeleken
met
stemmen
in
de
database
en
scores
of
afstanden
worden
berekend.
Bij
gesloten-set
identificatie
kiest
men
uit
een
beperkte
set
bekende
sprekers;
bij
open-set
kan
ook
onbekendheid
worden
herkend
en
gemarkeerd.
kan
gevoelig
zijn
voor
bias
en
is
kwetsbaar
voor
spoofing
zoals
stem-synthese
of
impersonatie.
Privacy-
en
wettelijke
overwegingen
spelen
een
belangrijke
rol,
vooral
bij
forensisch
werk;
correcte
validatie,
transparantie
in
methoden
en
naleving
van
regelgeving
zijn
vereist
en
vaak
aanvullend
bewijs
in
rechtszaken.