Home

ruisonderdrukkingstechnieken

Ruisonderdrukkingstechnieken zijn algoritmen en systemen die ruis uit audiosignalen verwijderen of verminderen, met als doel de verstaanbaarheid en de geluidskwaliteit van spraak te verbeteren. Ze worden toegepast in telecommunicatie, conferentiesystemen, hoortoestellen, opnames en spraakgestuurde assistenten.

De technieken kunnen worden onderverdeeld op basis van domein en benadering. In het tijd- en frequentiedomein

Verder is er een op data gebaseerd paradigma waarin diepe neurale netwerken spraak-ruismapping leren of maskers

Evaluatie gebeurt met onderwerpen als perceptuele evaluaties (PESQ), intelligibiliteit (STOI) en signaal-ruisverhouding (SDR/ SI-SDR). Veelvoorkomende toepassingen

worden
vaak
stappen
in
twee
fasen
uitgevoerd:
ruisdetectie
en
ruisverwijdering.
Klassieke
methoden
omvatten
onder
meer
ruisspectraal-subtractie,
waarbij
een
ruisprofiel
wordt
geschat
tijdens
stiltes
en
vervolgens
van
het
totale
spectrum
wordt
afgetrokken.
Wiener-
en
MMSE-achtige
schatters
vormen
probabilistische
benaderingen
die
proberen
de
optimale
ruisverwijdering
in
de
zin
van
minimale
gemiddelde
fout
te
kiezen
in
het
spectrale
domein.
Daarnaast
bestaan
er
modelgebaseerde
technieken
zoals
Kalman-filtering
en
subruimte-
of
beamformer-benaderingen
die
met
multi-microfoonopstellingen
werken
om
ruis
te
verminderen
op
basis
van
ruimtelijke
informatie.
in
het
spectrale
domein
voorspellen
waarmee
ruis
effectief
kan
worden
onderdrukt.
Deze
benaderingen
zijn
in
staat
om
complexe
en
niet-stationaire
ruis
beter
aan
te
pakken,
maar
vragen
vaak
rekenkracht
en
trainingdata.
In
multi-mekanautomaten
kunnen
beamforming
en
adaptieve
filtratie
gecombineerde
strategieën
leveren.
zijn
telefonie,
videoconferenties,
hoortoestellen
en
spraakgestuurde
systemen,
waar
ruisonderdrukking
de
gebruikerservaring
aanzienlijk
kan
verbeteren.
Uitdagingen
omvatten
artefacten
zoals
muzikale
ruis,
verlies
aan
natuurlijkheid
en
latency.