hiperparametry
Hiperparametry to wartości ustawiane przed rozpoczęciem procesu uczenia maszynowego i nie są one wyuczone z danych podczas treningu. W odróżnieniu od parametrów modelu, które są optymalizowane w procesie uczenia, hiperparametry wpływają na sposób i tempo nauki oraz na architekturę samego modelu.
W praktyce hiperparametry obejmują m.in. tempo nauczania (learning rate), rozmiar partii danych (batch size), liczbę warstw
Wybór hiperparametrów ma charakter poznawczy i kosztowny obliczeniowo. Typowe metody to ręczne strojenie, przeszukiwanie w siatce
Niektóre techniki pozwalają na dynamiczną zmianę hiperparametrów podczas treningu, na przykład harmonogramy tempa nauki czy wczesne
Rola hiperparametrów polega na równoważeniu złożoności modelu i możliwości danych, wpływając na dokładność, czas treningu i