Valideringsdataene
Valideringsdataene refererer til det settet av data som holdes atskilt fra treningsprosessen for å vurdere og finjustere en modell under utviklingen. De brukes primært til å estimere generaliseringsevnen og til å velge hyperparametre uten at treningsdata påvirker innstillingene.
Typisk deles dataene inn i treningsdata, valideringsdata og testdata. Valideringsdataene bør være representative for måldataene og
Under modelltrening brukes resultater på valideringsdataene til hyperparameter-tuning og til å avgjøre når treningen skal stoppe,
Viktige hensyn inkluderer å unngå datalekasje mellom trenings- og valideringsdata, å sikre at splittene er representative