ominaisuuspoiminta
Ominaisuuspoiminta on prosessi, jossa datasta valitaan pienempi, relevantti ominaisuusjoukko siten, että malli saavuttaa hyvän suorituskyvyn, kustannukset vähenevät ja tulkittavuus paranee. Poimittu ominaisuusjoukko voi koostua sekä mitattavista että johdetuista ominaisuuksista, ja poiminta voidaan tehdä ennen oppimista tai osana sitä.
Menetelmät jaetaan kolmeen päätyyppiin: suodatinmenetelmät, wrapper-menetelmät ja upotetut menetelmät. Suodatinmenetelmät arvioivat ominaisuuksien relevanssin riippumatta käytetystä oppimismallista
Esimerkkejä ovat: filter- menetelmissä korrelaatio- ja mutual information -mittarit sekä chi-neliötesti; wrapper-menetelmissä rekursiivinen ominaisuuksien poisto (RFE)
Käytännössä prosessi alkaa datan esikäsittelystä ja tavoitteen määrittelystä, jatkuu poimintamenetelmän valinnalla, ominaisuuksien valinnalla ja mallin arvioinnilla