ominaisuusvalinnan
Ominaisuusvalinta on prosessi, jossa valitaan joukko alkuperäisistä ominaisuuksista ne, jotka ovat merkityksellisimpiä ennustavan mallin kannalta. Tavoitteena on pienentää ulottuvuutta säilyttäen tai jopa parantaen ennustettavuutta, vähentää opetusajan kustannuksia sekä parantaa tulkittavuutta. Ominaisuusvalinta eroaa dimensiotason vähentämisestä sillä, että säilytetään alkuperäiset ominaisuudet ja valitaan osa niistä, kun taas monet dimensiotason vähentämisen menetelmät, kuten PCA, muuttavat ominaisuusvektoreita.
Yleisimmät lähestymistavat voidaan jakaa filtterimetodeihin, wrapper-menetelmiin ja sisäänrakennettuihin (embedded) menetelmiin. Filtterimetodit arvioivat ominaisuuksien merkityksen riippumatta käytetystä
Hyödyt ja haasteet: ominaisuusvalinta voi vähentää ylisovitusta, nopeuttaa koulutusta ja parantaa tulkintaa sekä suorituskykyä suurissa tai
Käyttökohteita ovat muun muassa tekstiaineistot, genomitiedot, sensoritiedot sekä talous- ja kuvatiedot. Ominaisuusvalintaa käytetään usein esiprosessointivaiheessa yhdessä