syväoppimismallien
Syväoppimismallien käsite viittaa koneoppimisen osa-alueeseen, jossa malleja rakennetaan useista kerroksista koostuvista keinotekoisista neuroverkoista. Ne oppivat datasta monitasoisia edustuksia ja pystyvät suorittamaan itsenäisesti monimutkaisia tehtäviä kuten luokittelua, ennustamista ja generointia. Opinnot perustuvat suurten datasetien läpikäyntiin sekä backpropagationiin ja gradientin laskemiseen, usein suurten laskentatehojen ja GPU-kiihdytyksen turvin.
Tyypillisiä arkkitehtuurityyppejä ovat konvoluutionaaliset verkot (CNN) kuvantunnistukseen, toistuvat verkot (RNN ja LSTM) sarjadatasta sekä transformer-arkkitehtuuriin perustuvat
Käyttökohteita ovat tietokonenäkö, puhe- ja äänisignaalit sekä luonnollisen kielen käsittely, suositusjärjestelmät sekä lääketiede ja teolliset sovellukset.
Haasteita ovat energian ja laskennan kustannukset, datan laatu ja saatavuus sekä vinoumien ja epävarmuuden herkkyys sekä