esiprosessointiin
Esiprosessointi eli preprocessing tarkoittaa aineiston valmistelua ennen varsinaista analyysiä tai mallin koulutusta. Sen tarkoituksena on parantaa datan laatua, vakauttaa suorituskykyä ja helpottaa seuraavien vaiheiden, kuten laskennan ja päätöksenteon, toimintaa. Esiprosessoinnissa käsitellään usein puuttuvia arvoja, virheellisiä mittaustuloksia sekä epäyhtenäisiä tietoja ja muokataan dataa siten, että se soveltuu paremmin mallinnukseen.
Esiprosessoinnin yleisiä toimenpiteitä ovat datan puhdistus, täydennys, virheellisten tai epäjärkevien arvojen korjaus, puuttuvien arvojen käsittely sekä
Joskus esiprosessointi sisältää kuvien, äänen tai tekstin esikäsittelyn: kuvan esikäsittelyyn voivat kuulua koon normalisointi, kohinanpoisto ja
Esiprosessoinnin toteutus on usein osa datankeruuprosessia ja data pipelinea. Tärkeimpiä huomioita ovat toistettavuus ja läpinäkyvyys sekä