ljudklassificering
Ljudklassificering är processen att tilldela ljudsegment eller hela ljud till en eller flera etiketter baserat på dess akustiska innehåll. Syftet är att automatiskt upptäcka, identifiera eller särskilja ljudkällor eller händelser i ljudinspelningar. Den används inom områden som miljöövervakning, säkerhet, multimedia och assistiv teknik.
Metoderna bygger vanligtvis på att extrahera funktioner ur ljudet, exempelvis MFCC, spektrala egenskaper, zero-crossing rate och
Datasets och utvärdering är centrala för utvecklingen. Vanliga konstruktioner är ESC-50, UrbanSound8K och GTZAN. Utvärdering utförs
Tillämpningar inkluderar miljö- och urbanljudklassificering för övervakning, detektering av farliga eller akustiska händelser, musikinformation och innehållsbaserad
Utmaningar innefattar brus och bakgrundsljud, variationer i inspelningsförhållanden, otydliga eller osäkra etiketter, klassobalans, och krav på