Aktivaatiofunktioiden
Aktivaatiofunktioiden tarkoitus on tuoda keinoverkkoihin ei-lineaarisuutta ja mahdollistaa monimutkaisten toimintojen oppiminen. Jokainen neuroni saa lineaarisen yhdistelmän syötteistään z = Σ w_i x_i + b ja tuottaa aktivaatioarvon a = f(z). Ilman ei-lineaarisuutta verkko pystyisi mallintamaan vain lineaarisia suhteita, jolloin syvyyden lisäys ei parantaisi suorituskykyä.
Yleisimmät aktivaatiofunktion tyypit ovat sigmoid, tanh ja ReLU sekä näiden variantit. Sigmoid-funktio on f(z) = 1/(1+e^{-z}) ja
Ominaisuudet ja koulutuksen vaikutukset: aktivaatiofunktiot ovat pääsääntöisesti derivoituvia, mikä mahdollistaa takaisinkytkennän ja oppimisen. Ne voivat olla
Käyttö käytännössä: piilokerrosten aktivaatioina käytetään yleisesti ReLU-tyyppejä, kun taas ulostulokerroksessa valinta riippuu tehtävästä. Moniluokkaisessa luokituksessa käytetään
---