krosszvalidáció - Infinite Lexicon - Infinite Lexicon

krosszvalidáció

Krosszvalidáció egy statisztikai módszer a prediktív modellek általánosíthatóságának becslésére. Az adathalmazt több részre osztva a modellt többször tanítjuk és értékeljük, így a képzési és a validációs adatok szétválasztása révén kevésbé függ a véletlentől az előrejelzési teljesítmény. A leggyakoribb változat a k-fold cross-validation, ahol az adathalmazt k egyenlő részre osztjuk, és minden iterációban az egyik részre kerül az értékelés, a többi részről pedig a modell tanul. Ezt k-szer megismételjük, majd az egyes iterációk eredményeinek átlaga adja a becslést. Klasszifikáció esetén gyakori a stratified k-fold, amely megőrzi az osztályok arányát minden összetevőben.

Összetett feladatoknál a leave-one-out (LOOCV) esetet alkalmazzák, ahol minden példányt egyszeri tesztpéldánynak használnak, a többit tanítóhalmazként.

Előnyök közé tartozik a generalizációs hibára vonatkozó stabil becslés, különösen kis adathalmazokra. Hátrányai közé sorolható a

A

krosszvalidációt

modellválasztáshoz

hiperparaméter-optimalizáláshoz,

cross-validation

alkalmazásával

a

információátvitel

a

paraméterbecslés

a

teljesítményértékelés

a

a

Időszorozatoknál

a

idősorozat-specifikus