hyperparametri
Hyperparametri on koneoppimismallin koulutusta ohjaava asetus, joka määritellään ennen oppimista. Toisin kuin mallin parametrit, joita algoritmi oppii datasta, hyperparametrit pysyvät kiinteinä koulutuksen aikana ja vaikuttavat sekä oppimisen tehokkuuteen että mallin yleistyvyyteen.
Yleisiä hyperparametreja ovat oppimisnopeus (learning rate), optimointialgoritmi (esim. SGD, Adam), sekä batch-koko. Arkkitehtuurin hyperparametrit kuten piilotettujen
Hyperparametrien optimointi voidaan tehdä manuaalisesti tai järjestelmällisesti. Yleisimmät menetelmät ovat grid search, random search ja bayesiläinen
Hyperparametrien valinnat vaikuttavat sekä suorituskykyyn että koulutuksen kestoon. Ne voivat olla herkästi riippuvaisia datasta ja johtaa