Aktivaatiofunktioiden - Infinite Lexicon - Infinite Lexicon

Aktivaatiofunktioiden

Aktivaatiofunktioiden tarkoitus on tuoda keinoverkkoihin ei-lineaarisuutta ja mahdollistaa monimutkaisten toimintojen oppiminen. Jokainen neuroni saa lineaarisen yhdistelmän syötteistään z = Σ w_i x_i + b ja tuottaa aktivaatioarvon a = f(z). Ilman ei-lineaarisuutta verkko pystyisi mallintamaan vain lineaarisia suhteita, jolloin syvyyden lisäys ei parantaisi suorituskykyä.

Yleisimmät aktivaatiofunktion tyypit ovat sigmoid, tanh ja ReLU sekä näiden variantit. Sigmoid-funktio on f(z) = 1/(1+e^{-z}) ja

Ominaisuudet ja koulutuksen vaikutukset: aktivaatiofunktiot ovat pääsääntöisesti derivoituvia, mikä mahdollistaa takaisinkytkennän ja oppimisen. Ne voivat olla

Käyttö käytännössä: piilokerrosten aktivaatioina käytetään yleisesti ReLU-tyyppejä, kun taas ulostulokerroksessa valinta riippuu tehtävästä. Moniluokkaisessa luokituksessa käytetään

---

=

(e^{z}-e^{-z})/(e^{z}+e^{-z}).

=

parantamiseksi.

käyttäytymiseen.

saturoituneilla

“kuolleita”

säännöllistämisestä;

käytännössä

binaariluokituksessa