kfoldristiinvalidaatio
K-fold ristiinvalidaatio on tilastollinen arviointimenetelmä, jota käytetään koneoppimisessa mallin suorituskyvyn arviointiin. Menetelmä jakaa aineiston satunnaisesti k yhtä suureen osioon (foldiin). Jokaisella kierroksella malli opetetaan käyttäen k−1 foldia ja testataan yhdellä erillisellä foldilla. Tämä toistetaan niin monta kertaa kuin foldia on, jolloin jokainen osuus toimii kerran testijoukkona. Lopullinen suorituskykyestimaatti saadaan useiden testihetkien mittausten keskiarvona (ja usein hajontana).
Stratifioitu k-fold-valinta on yleinen muunnelma, jossa jokaisessa foldissa säilytetään koko aineiston luokkien jakauma, mikä on tärkeää
K-fold-validaatiolla on hyödyt ja rajoitukset. Se mahdollistaa tehokkaamman aineiston hyödyntämisen verrattuna perinteiseen jaon yhdellä treenaus- ja
Käytännössä k-fold-validaatiota sovelletaan mallien vertailuun, hyperparametrien valintaan ja mallin suorituskyvyn raportointiin. Työkalut kuten scikit-learn tukevat tämän