ominaisuusjoukosta
Ominaisuusjoukko on datan piirteiden tai ominaisuuksien kokonaisuus, joita käytetään kuvaamaan kutakin datapistettä tai havaintoa datasetissä. Jokainen piirre antaa arvon, joka voi olla numeerinen, kategorinen tai binäärinen. Ominaisuusjoukon avulla data esitetään tilastollisesti ja sitä käytetään erilaisten analyyttien sekä mallien lähtökohtana.
Datapisteelle muodostuu ominaisuusvektori, jonka pituus vastaa piirteiden lukumäärää. Tämä vektori syötetään tilastollisiin menetelmiin, koneoppimismalleihin sekä muille
Ominaisuusjoukko on keskeinen käsite sekä tilastotieteessä että koneoppimisessa. Sen laadulla on suora vaikutus mallin suorituskykyyn ja
Käytännön huomioita: kategoriset piirteet voidaan koodata one-hot-enkoodauksella, numeeriset piirteet voidaan standardoida tai normalisoida, ja puuttuvat arvot
Esimerkki: kiinteistötietoaineistossa ominaisuusjoukko voi sisältää kaupungin, rakennusvuoden, pinta-alan, huoneiden lukumäärän ja energialuokan. Näiden piirteiden perusteella voidaan