hyperparametreja
Hyperparametreja ovat opetusprosessin aikana ennen koulutuksen aloittamista määritettävät arvot, toisin kuin mallin opittavat parametrit (esim. verkon painot), jotka oppivat datasta. Hyperparametrit vaikuttavat mallin rakenteeseen, oppimisen nopeuteen ja siihen, miten hyvin malli yleistyy uusiin datoihin. Oikea valinta voi nopeuttaa konvergenssia, ehkäistä ylikehittymistä ja parantaa suorituskykyä.
Esimerkkejä hyperparametreista ovat oppimisnopeus (learning rate), malliarkkitehtuuriin liittyvät valinnat kuten kerrosten määrä ja tyypit, säännöllistämisen parametrit
Hyperparametrien virittäminen voidaan tehdä manuaalisesti, mutta yleensä käytetään hakumenetelmiä kuten grid search ja random search. Tehokkaammat
Hyödyllistä on käyttää erillistä testijoukkoa sekä dokumentoida ja raportoida sovellettavat hyperparametrit ja asetukset. Liiallinen hyperparametrien viilaus
Työkalut kuten Optuna, Hyperopt ja Ray Tune helpottavat hyperparametrien virittämistä ja toistettavien kokeiden hallintaa.