ominaisuustiedoilla
Ominaisuustiedoilla tarkoittaa suomen kielessä tilannetta, jossa analyysissä käytetään kohteen ominaisuuksia—eli attribuutteja—kuvia tietoja. Käsite esiintyy erityisesti data-analyysissä, tilastotieteessä ja koneoppimisessa. Ominaisuustiedot muodostavat datasetin piirteet, joita käytetään kohteen mallintamiseen tai ennustamiseen.
Tyypillisesti ominaisuustiedoilla tarkoitetaan taulukkomuotoista dataa, jossa rivit ovat havaintoja ja sarakkeet ovat ominaisuuksia. Mallinnuksessa näitä ominaisuustietoja
Käytännössä ominaisuustiedoilla työskentelyyn kuuluu ominaisuuksien valinta ja muokkaus (feature engineering), yhdenmukaistaminen, numeeristen muuttujien normalisointi sekä kategoristen
Haasteita ovat puuttuvat tai virheellisesti mitatut ominaisuustiedot, ominaisuuksien skaalautuminen, korreloituneet piirteet sekä mahdollinen vinouma tai vääristymä
Lisää aiheesta: ominaisuudet, feature engineering, data preprocessing, dataset, koneoppiminen.