Home

resamplingmenetelmät

Resamplingmenetelmät ovat tilastollisia ei-parametrisia tekniikoita, joissa havaintoainesidosta pyritään tekemään johtopäätöksiä toistojen avulla ilman vahvoja jakautumismalleja. Niiden ajatus on resarnoida tai uudelleen muokata olemassa olevaa dataa muodostaen reliabiliteetin ja epävarmuuden arviointia sekä mallien vertailua.

Bootstrap on yleisimmin käytetty resamplingmenetelmä. Siirtämällä dataan otoksia paikoillaan palautuksella saadaan useita uusintanäytteitä, joiden avulla voidaan

Permutaatiotestit eli rehyläyssovitukset tarjoavat ei-parametrista tilastollista testausmenetelmää, jossa nollahypoteesin mukaisia jakaumia rakennetaan arpomalla tai uudelleen järjestämällä

Ristivarmennus (cross-validation) mittaa mallin ennustepäätettä käyttämällä aineiston jakamista opetusaineistoon ja testausaineistoon useiden kerrosten kautta. Yleisiä muotoja

Jackknife ja leave-one-out ovat pienemmän mittakaavan resampling-variantoja, joissa poistetaan yksittäisiä havaintoja tai pieniä osia aineistosta ja

Bootstrapia ja siihen liittyviä menetelmiä käytetään myös bagging- ja muissa bootstrap-ensempleteissa, kuten satunnaisissa metsissä, joiden tarkoituksena

Riippuvaiset havainnot, kuten aikadatat, vaativat erityisratkaisuja (esim. block bootstrap). Käytännössä valinta ja tulkinta riippuvat aineiston ominaisuuksista

estimoida
tilastollisia
vaihteluita
kuten
standardivirheitä,
harhan
estimointia
sekä
luottamusvälejä
(esim.
percentile-
tai
BCa-välejä).
Bootstrap
soveltuu
monenlaisiin
estimointitehtäviin
ilman
vahvaa
parametrista
oletusta.
havaintoja,
esimerkiksi
ryhmien
merkkijonoja.
Tämä
antaa
signifikaatiotason
tulkintoja
riippumattomasta
mallista.
ovat
k-fold-ristivarmennus
ja
leave-one-out
(LOOCV).
Menetelmät
auttavat
sekä
mallin
valinnassa
että
sen
yleisen
suorituskyvyn
arvioinnissa.
mitataan
vaikutusta
estimaatioihin,
kuten
virheisiin
ja
harhoihin.
on
vähentää
vaihtelua
ja
parantaa
ennustavuutta.
sekä
vastaavan
ongelman
tarkoituksesta.