hiperparametry

Hiperparametry to wartości ustawiane przed rozpoczęciem procesu uczenia maszynowego i nie są one wyuczone z danych podczas treningu. W odróżnieniu od parametrów modelu, które są optymalizowane w procesie uczenia, hiperparametry wpływają na sposób i tempo nauki oraz na architekturę samego modelu.

W praktyce hiperparametry obejmują m.in. tempo nauczania (learning rate), rozmiar partii danych (batch size), liczbę warstw

Wybór hiperparametrów ma charakter poznawczy i kosztowny obliczeniowo. Typowe metody to ręczne strojenie, przeszukiwanie w siatce

Niektóre techniki pozwalają na dynamiczną zmianę hiperparametrów podczas treningu, na przykład harmonogramy tempa nauki czy wczesne

Rola hiperparametrów polega na równoważeniu złożoności modelu i możliwości danych, wpływając na dokładność, czas treningu i

i

w

optymalizatora,

w

i

hiperparametrów,

W

i

eksperymentowania.