multikollineaarisuuden
Multikollineaarisuus on tilastollinen ilmiö, joka esiintyy monimuuttujaisessa lineaarisessa regressiomallissa, kun kaksi tai useampi selittävä muuttuja ovat voimakkaasti korreloituneita keskenään. Tällöin mallin kertoimet voivat olla epätarkkoja ja niiden varianssit suuria, mikä vaikeuttaa muuttujien vaikutusten erottamista ja tulkintaa.
Täydellinen multikollineaarisuus tapahtuu, kun jokin selittäjä on täsmälleen lineaarinen yhdistelmä muista. Tällöin X-matriisi ei ole käännettävissä
Diagnostiset mittarit: yleisimpiä ovat toleranssi ja varianssin inflaatiokerroin (VIF). Toleranssi alle 0,1–0,2 tai VIF yli 5–10
Korjauskeinoja: muuttujien poistaminen tai yhdistäminen, muuttujien kierrätys tai uudelleenmuotoilu, esimerkiksi ottamalla keskiarvoja tai yhteisiä kertoimia. Tärkeitä
Multikollineaarisuus on yleinen ja usein hallittavissa oleva haaste erityisesti havaintoaineistoissa, joissa muuttujat ovat luonteeltaan samankaltaisia. Tulosten