hyperparametreistä
Hyperparametrit ovat koneoppimismalleissa ulkoisia asetuksia, jotka määritellään ennen mallin koulutusta ja joita ei opita datasta itsessään. Toisin kuin mallin parametrit, jotka ovat mallin sisäisiä painokertoimia ja bias-termejä, jotka optimoidaan koulutusprosessin aikana, hyperparametrien arvot valitaan ennalta. Ne ohjaavat mallin oppimisprosessia ja vaikuttavat merkittävästi mallin suorituskykyyn ja yleistyskykyyn.
Tyypillisiä hyperparametreja ovat esimerkiksi oppimisnopeus, joka määrittää, kuinka suuria askelia malli ottaa painokertoimia päivittäessään, tai piilotettujen
Hyperparametrien optimaalisten arvojen löytäminen on keskeinen osa mallin viritystä. Tähän käytetään erilaisia hakumenetelmiä, kuten ruudukkoetsintää (grid