regressiomalleissa
Regressiomalleissa viitataan tilastollisiin malleihin, jotka kuvaavat riippuvan muuttujan Y ja yhden tai useamman riippumattoman muuttujan Xn välistä suhdetta. Mallin perusmuoto on lineaarinen: Y = β0 + β1 X1 + ... + βk Xk + ε, jossa β0...βk ovat parametreja ja ε satunnaisvirheitä. Eri regressiotyypit sallivat erilaisten riippuvuuksien mallintamisen; yleisimmät ovat lineaarinen regressio ja Generalized Linear Models (GLM), johon kuuluvat esimerkiksi logistinen regressio sekä Poisson-regressio.
Olettukset: lineaarisuus, riippumattomuus, homoskedastisuus ja residuissa normaalijakautuneisuus; monimutkaisemmissa malleissa voidaan käyttää ei-lineaarisia tai GLM-tyyppejä. Estimointi suoritetaan
Mallin arviointi: selitysaste (R-squared), RMSE, sekä AIC/BIC, ja ristiinvalidointi. Regressiomallit ovat keskeisiä työvälineitä, kun tutkitaan riippuvaisten
Käyttökohteet: taloustiede, biologia, psykologia, sosiologia ja insinööritieteet. Mallien tulkinnassa on huomioitava ero korrelaation ja kausaation välillä;
Esimerkki: Y = β0 + β1 X1 + ε, jossa X1 on jonkin selittäjän arvo.