ominaisuusjoukkoja
Ominaisuusjoukko tarkoittaa tilastollisessa ja koneoppimisen kontekstissa ominaisuuksien (muuttujien) kokoelmaa. Ominaisuus tai muuttuja kuvaa dataesityksen piirteen, kuten mitattua arvoa tai luokkaa. Ominaisuusjoukko on siis kokonaisuus, josta koostetaan ominaisuusvektoreita, jotka kuvaavat yksittäisiä havaintoja.
Ominaisuusjoukkoa käytetään datamallien rakentamisessa: se määrittelee, mitä dataa algoritmille tarjotaan. Esimerkki: asiakkaiden tietokanta voi sisältää iän,
Usein tavoitteena on optimoida ominaisuusjoukko: valita merkittävät ominaisuudet (ominaisuusvalinta) tai projisoida ulos tärkeimmät ulottuvuudet pienempään tilaan
Preprocessingin aikana ominaisuusjoukkoa saatetaan muun muassa normalisoida tai standardoida, käsitellä puuttuvia arvoja ja muuntaa kategoriset ominaisuudet
Ominaisuusjoukkojen käyttö ja koostumus vaihtelevat sovelluksesta ja mallityypistä, ja hyvän ominaisuusjoukkojen valinnan taito on keskeinen osa