regresskomennot
Regresskomennot ovat tilastollisia komentoja tai funktiokutsuja, joita käytetään regressiomallien estimointiin erilaisissa ohjelmistoissa. Niiden tehtävänä on määritellä riippuva muuttuja ja selittäjät, valita malli sekä konfiguroida estimaatio- ja tulostusasetukset. Regressi-komennot kattavat tyypillisesti lineaarisen regression, yleisten lineaaristen mallien (GLM), logistisen regression sekä muita johdettuja malleja kuten Poisson- ja Poisson-negatiivinen binäärinen malli.
Käyttömuoto ja syntaksi vaihtelevat ohjelmistosta riippuen, mutta niillä on usein yhteinen idea: määritetään malli kaavan tai
Useat yleisesti käytetyt ohjelmistot sisältävät omia regressi-komentokantojaan:
- R: lm tai glm -perheet, joissa kaava-notation ja perusvalinnat ovat yleisiä.
- Stata: regress, logistiset mallit kuten logit tai probit.
- Python (statsmodels): y ~ X-formulaatiot tai OLS/GLM-rajapinnat.
- SAS: PROC REG, PROC LOGISTIC ja muut GLM-paketit.
- SPSS ja MATLAB tarjoavat vastaavia regressi-tilan komentoja.
Regresskomentojen käyttö vaatii huolellista datan esivalmistelua sekä mallin diagnoosia, kuten residuals-vertailua, multikollineaarisuuden tarkastelua ja mahdollisia ylikoulutuksen