esikäsittelyalgoritmien
Esikäsittelyalgoritmit ovat keskeinen osa data-analytiikkaa ja koneoppimista. Niiden tavoitteena on parantaa datan laatua ja muokata sitä siten, että se soveltuu paremmin analyysiin tai mallien koulutukseen. Monet algoritmit ovat herkkiä datan esitystavalle, ja huono esikäsittely voi johtaa virheellisiin tuloksiin tai heikentyneeseen suorituskykyyn.
Yleisiä esikäsittelyalgoritmien tehtäviä ovat puuttuvien arvojen käsittely, joko poistamalla rivejä tai sarakkeita, tai täyttämällä puuttuvat arvot
Muita esikäsittelyn vaiheita voivat olla kategoristen muuttujien muuntaminen numeerisiksi (esim. one-hot encoding), ulkoneiden eli poikkeavien havaintojen