äänentunnistusta
Äänentunnistus on prosessi, jossa järjestelmä analysoi ja tulkitsee kuultua äänisignaalia sekä luokittelee sen eri kategorioihin. Keskeisiä tavoitteita ovat puheen tunnistus sekä ei-puheäänien, kuten ympäristö- tai musiikkiäänien, tunnistus. Äänentunnistus voi toimia sekä offline- että reaaliaikaisesti suoritetuissa sovelluksissa.
Tekniikat ja menetelmät perustuvat sekä perinteisiin signaalinkäsittelyn keinoihin että koneoppimiseen. Tavallisia esiprosessioreita ovat spektrigrammit ja havaitut
Sovellukset kattavat laajan kirjon. Puheentunnistus muuntaa puhuttua kieltä tekstiksi ja mahdollistaa puheohjauksen. Henkilötunnistus (speaker recognition) sekä
Haasteet liittyvät etenkin melun ja monisävelisyyden hallintaan, taustamelun sopeutumiseen, äänilähteiden erotteluun sekä kulttuuri- ja puhujakohtaisiin vaihteluihin.