regresioanalyysit
Regresioanalyysit ovat tilastollisia menetelmiä, joiden avulla tutkitaan riippuvan muuttujan arvojen ja yhden tai useamman riippumattoman muuttujan arvojen välistä suhdetta sekä tehdään ennusteita.
Yksinkertainen lineaarinen regressio tarkastelee suoraa suhdetta kahden muuttujan välillä y = β0 + β1x + ε, kun taas useamman selittäjän
Estimaatio tapahtuu usein pienimmän neliösumman menetelmällä. Mallin soveltuvuutta arvioidaan esimerkiksi R-squaredin, säädetyllä R-squaredilla, F-testillä ja tilastollisilla
Laajennuksia ovat generalized linear models (GLM), logistinen regressio binäärisille tuloksille, Poisson-regressio taudin ilmaantuvuudelle sekä säännöllistetyt mallit
Käyttökohteita ovat taloustiede, biostatistiikka, psykologia ja muut alat. Regresioanalyysiä käytetään sekä yhteyksien ymmärtämiseen että ennustamiseen, ja
Riskejä ja haasteita ovat muun muassa korrelaation ja syy-seuraussuhteen erottaminen, multikollineaarisuus, overfitting sekä epäluotettavat mittaukset. Oikea
Työkalut vaihtelevat yleisissä ohjelmistoissa kuten R, Python (statsmodels, scikit-learn), SPSS, SAS ja Stata.