tréningvalidációteszt
A tréning-validációteszt a gépi tanulásban használt adathalmaz-szétosztási eljárás, amelynek célja a modell teljesítményének megbízható értékelése és a hiperparaméterek finomhangolása. Az adatok általában három részre oszlanak: tréning, validáció és teszt.
A tréningkészletet a modell megtanítására használják. A validációs készletet a hiperparaméterek beállítására és a modell általánosítási
Különböző szétosztási stratégiák léteznek. A hagyományos módszer a hold-out, amikor az adatok véletlenül kerülnek a három
Gyakorlati szempontok: elkerülhető a adat-szivárgás, az előfeldolgozási lépések és a kódolások csak a tréning adathalmazon történő
A tipikus értékelő mutatók a feladat típusától függnek: osztályozásnál például pontosság, precizitás, recall, F1-score; regresszióban RMSE
Összegzés: a tréning-validációteszt fontos eszköz a modellek fejlesztésében, amely segít a túlilleszkedés megelőzésében és a valódi