dummykoodauksella
Dummykoodauksella tarkoitetaan tilastollisessa kontekstissa muuttujien muuntamista numeerisiksi niin, että kategoriset muuttujat voidaan sisällyttää tilastollisiin malleihin, kuten regressioihin ja luokitteluihin. Menetelmä mahdollistaa kategoristen arvojen vaikutusten arvioimisen paremmin sekä helpottaa yhtenäisten estimointien saamista.
Perusidea on luoda jokaisesta kategorian luokasta binäärinen muuttuja (0 tai 1). Usein käytetään k-1 muuttujaa, jos
Käyttökohteet ja tulkinta ovat tärkeä osa dummykoodauksen hyödyntämistä. Dummylisättyjä muuttujia käytetään lineaarisessa ja logistisessa regressiossa sekä