Esikäsittelykomponentit
Esikäsittelykomponentit ovat keskeinen osa datan analysointia ja koneoppimista. Ne viittaavat erilaisiin prosesseihin ja tekniikoihin, joita käytetään raakadatan muuntamiseksi muotoon, joka soveltuu paremmin analyysiin tai mallin koulutukseen. Tavoitteena on parantaa datan laatua, vähentää virheitä ja monimutkaisuutta sekä tehdä siitä ymmärrettävämpää ja hyödynnettävämpää.
Yleisiä esikäsittelyvaiheita ovat puuttuvien arvojen käsittely, joissa tyhjiä tai puuttuvia datapisteitä täytetään esimerkiksi keskiarvolla, mediaanilla tai
Lisäksi esikäsittelyyn voi kuulua kategoristen muuttujien muuntaminen numeeriseen muotoon, esimerkiksi one-hot-enkoodauksella. Datan jakaminen koulutus- ja testausjoukkoihin