syötemuuttujien
Syötemuuttujat ovat datan ominaisuuksia, joita käytetään ennustavissa malleissa tai tilastollisissa analyyseissä. Ne toimivat syötteinä mallin oppimiselle ja niistä muodostetaan arviota riippuvasta muuttujasta, jota kutsutaan usein tavoite-, vaste- tai riippuvaksi muuttujaksi. Syötemuuttujat voivat kuvailla esimerkiksi demografisia tietoja, mittaustuloksia tai ympäristötekijöitä, ja niiden tarkoituksena on tarjota mallille informaatiota siitä, miten vastemuuttujaan liittyvät ilmiöt ilmenevät.
Syötemuuttujia on erilaisia ja ne voidaan luokitella muun muassa numeerisiin ja kategorisiin muuttujiin. Numeeriset syötemuuttujat ovat
Esikäsittely on tärkeää: puuttuvat arvot ratkaistaan tai poistetaan, muuttujat skaalataan tai normalisoidaan, ja kategoriset arvot muutetaan
Käytännössä syötemuuttujien valinta vaikuttaa mallin suorituskykyyn, tulkittavuuteen ja yleistettävyyteen. Oikea joukko syötemuuttujia antaa parempia ennusteita ja