keresztvalidációval
A keresztvalidációval a modell általánosítási teljesítményét becsüljük meg úgy, hogy az adathalmazt több részre osztják, majd a részleggel többször végrehajtják a tanítást és a kiértékelést. Az ilyen megközelítés csökkenti a véletlen felosztás okozta torzítást, és lehetővé teszi a modellek és beállítások összehasonlítását.
A leggyakoribb formája a k-keresztvalidáció: az adathalmazt k egyenlő részre osztják, minden iterációban a modell a
Speciális változataik közé tartozik a stratifikált k-keresztvalidáció, amely a klasszertartományt megőrzi a felosztás során, és a
Fontos szempont, hogy a keresztvalidációt gondosan alkalmazzák: minden előfeldolgozási lépést, például skálázást, a keresztvalidáció minden iterációjában
Alkalmazási területei: modellértékelés, modellválasztás és a generalizáció becslése, különösen korlátozott adathalmazok esetén.