esikäsittelymenetelmistä
Esikäsittelymenetelmät ovat joukko prosesseja, joita käytetään datan valmisteluun analysointia, koneoppimista tai muuta tiedonkäsittelyä varten. Tavoitteena on parantaa datan laatua, johdonmukaisuutta ja käyttökelpoisuutta. Yleisiä esikäsittelyvaiheita ovat datan puhdistus, muuntaminen ja vähentäminen.
Datan puhdistus kattaa virheiden, puuttuvien arvojen ja epäjohdonmukaisuuksien käsittelyn. Puuttuvia arvoja voidaan korvata keskiarvoilla, mediaaneilla tai
Datan muuntaminen sisältää datan muokkaamisen haluttuun muotoon. Tämä voi sisältää datan skaalaamisen, normalisoinnin tai ominaisuuksien luomisen.
Datan vähentäminen keskittyy datan koon pienentämiseen säilyttäen samalla sen tärkeimmät tiedot. Tämä voi tapahtua ominaisuusvalinnan, jossa