ordinalenkoodaus
Ordinalenkoodaus on kategoristen muuttujien koodausmenetelmä, jossa luokkien välistä luonnollista järjestystä säilytetään numeerisena. Se on yleisesti käytetty esikäsittelyvaiheessa koneoppimisessa, kun halutaan säilyttää järjestyksen tieto ilman täysimittaista one-hot-koodausta. Toisin kuin joissain muissa koodausmenetelmissä, ordinaalinen koodaus antaa jokaiselle luokalle arvon, joka heijastelee sen sijainnin järjestyksessä.
Käytännössä luokkia koodataan siten, että pienin arvo vastaa matalinta luokkaa ja suurin arvo korkeinta luokkaa. Esimerkkinä
Soveltuvuus riippuu mallista ja datasta. Ordinaalinen koodaus voi parantaa suorituskykyä joissain tapauksissa, erityisesti kun malli voi
Esimerkki: jos muuttuja on koulutustaso, voidaan määrittää arvoiksi 1 = perus, 2 = keskitaso, 3 = korkea. Jos luokkien
Ordinalenkoodaus on yksi useista työkaluista datan esikäsittelyssä, ja sen käyttö kannattaa perustaa ensin datan luonteeseen ja