äänentunnistuksessa
Äänentunnistus, suomeksi myös puheentunnistus tai puheenkäsittely, on teknologia, joka mahdollistaa tietokoneiden ja muiden laitteiden "ymmärtää" ihmisen puhetta. Se muuntaa äänisignaalin tekstiksi, jota tietokone voi sitten käsitellä ja hyödyntää eri tehtävissä. Prosessiin kuuluu useita vaiheita. Ensin äänisignaali kerätään mikrofonin avulla. Tämän jälkeen signaali esikäsitellään, poistetaan taustamelua ja normalisoidaan. Seuraavaksi äänestä erotetaan piirteitä, kuten taajuusominaisuuksia, jotka kuvaavat puheen akustisia ominaisuuksia. Nämä piirteet syötetään sitten akustiseen malliin, joka yhdistää ne foneemeihin eli puheen pienimpiin äänneyksiköihin. Lopuksi kielimalli auttaa tunnistamaan foneemeista sanoja ja lauseita, ottaen huomioon kielen rakenteen ja todennäköisyyden.
Äänentunnistusteknologiaa käytetään monenlaisissa sovelluksissa. Yksi tunnetuimmista on puheavustajat, kuten Siri, Google Assistant ja Alexa, jotka reagoivat