regressionissa
Regressionissa tarkoitetaan tilastotieteellistä lähestymistapaa, jolla arvioidaan ja tulkitaan riippuvan muuttujan ja yhden tai useamman selittäjän välistä suhdetta. Sen päätavoitteet ovat ennusteiden laatiminen ja riippuvuuksien tulkinta tutkimusaineistossa.
Perusmalli on lineaarinen regressio: Y = β0 + β1X1 + ... + βpXp + ε, missä ε on sattumanvarainen virhetermi. Parametrit β:t estimaaidaan
Olettamat: lineaarinen suhde, riippumattomuus, homoskedastisuus, normaalijakautuneisuus residuuille; monimutkaisemmissa malleissa voidaan tarkastella multikollineaarisuutta ja residuaalianalyysiä.
Regressiota käytetään monilla aloilla: taloustiede, epidemiologia, psykologia, biologia, insinöörit. Se voi olla lineaarinen, ei-lineaarinen tai osa
Huomioitavaa: korrelaatio ei tarkoita kausaatiota; ylisovitus, valitun mallin kompleksisuus sekä extrapolointi riskit.
Esimerkki: Y = β0 + β1X1 + β2X2 + ε. Jos β1 > 0, X1:n kasvaessa ennustettu Y kasvaa.