valiandmete
Valiandmed on andmestiku osa, mida kasutatakse mudeli arengul selle hindamiseks ja hüperparameetrite optimeerimiseks. Need andmed eraldatakse treeningandmestikust, kuid neid ei kasutata mudeli koolitamiseks. Valideerimise peamine eesmärk on hinnata mudeli üldistamist ning võrrelda erinevaid mudeleid või seadistusi enne lõpliku hindamise teostamist testandmetel.
Kõige levinumad valiandmete kasutamise meetodid on hold-out jagamine ja ristvalideerimine (k-fold). Hold-out jagab andmestiku tavaliselt kolmeks
Olulised kaalutlused hõlmavad valiandmete esinduslikkust, stratifikatsiooni klassijaotuses ning andmete lekkimise vältimist, et testandmed ei satu treeningprotsessi.
Tulemuste kajastamisel esitatakse hindamiskriteeriumid (nt täpsus, F-measure) ning kirjeldatakse metoodikat, et tulemused oleksid reprodutseeritavad. Valideerimine on