onehotkoodaus
Onehotkoodaus, englanniksi one-hot encoding, on tilastollisessa ja koneoppimisessa käytetty menetelmä kategoristen muuttujien muuntamiseksi numeeriseksi dataksi. Jokaiselle muuttujan mahdolliselle arvolle luodaan oma binäärinen ominaisuutensa, joka on 1 silloin kun havainto kuuluu kyseiseen arvoon ja 0 muussa tapauksessa. Menetelmä mahdollistaa sen, että kategorioiden välillä ei oleteta järjestystä tai etäisyyksiä.
Esimerkki: Väriarvot {punainen, vihreä, sininen}. One-hot-vasteet ovat punainen -> [1,0,0], vihreä -> [0,1,0], sininen -> [0,0,1]. Kun kategorioita on
Käyttö ja huomiot: Onehotkoodausta käytetään yleisesti, kun malli tarvitsee numeerista syötettä, kuten useissa tilastollisissa malleissa ja
Sovellukset ja kehitys: Perinteisesti onehotkoodausta käytettiin laajasti luonnollisen kielen prosessoinnissa (bag-of-words -tyylisissä esityksissä). Nykyään suurissa sanastoissa