krosszvalidáció
Krosszvalidáció egy statisztikai módszer a prediktív modellek általánosíthatóságának becslésére. Az adathalmazt több részre osztva a modellt többször tanítjuk és értékeljük, így a képzési és a validációs adatok szétválasztása révén kevésbé függ a véletlentől az előrejelzési teljesítmény. A leggyakoribb változat a k-fold cross-validation, ahol az adathalmazt k egyenlő részre osztjuk, és minden iterációban az egyik részre kerül az értékelés, a többi részről pedig a modell tanul. Ezt k-szer megismételjük, majd az egyes iterációk eredményeinek átlaga adja a becslést. Klasszifikáció esetén gyakori a stratified k-fold, amely megőrzi az osztályok arányát minden összetevőben.
Összetett feladatoknál a leave-one-out (LOOCV) esetet alkalmazzák, ahol minden példányt egyszeri tesztpéldánynak használnak, a többit tanítóhalmazként.
Előnyök közé tartozik a generalizációs hibára vonatkozó stabil becslés, különösen kis adathalmazokra. Hátrányai közé sorolható a