normalisointimenetelmien
Normalisointimenetelmien tarkoituksena on muuttaa muuttujien mittakaavat vertailukelpoisiksi, jotta data soveltuu paremmin tilastolliseen analyysiin sekä koneoppimismalleihin. Ilman asianmukaista skaalautumista erilaiset ominaisuudet voivat vaikuttaa mallien oppimiseen epätasaisesti, erityisesti etäisyyksiin ja lineaarisuuteen perustuvissa menetelmissä.
Yleisimmät lähestymistavat ovat min-max-normalisointi, standardisointi ja robust scaling. Min-max-normalisoinnissa uusi arvo on x' = (x − min(X)) / (max(X)
Laajemmasta muunnosvalikoimasta löytyvät logaritmimuunnokset sekä muunnokset Box-Cox ja Yeo-Johnson. Box-Cox on tarkoitettu positiivisille arvoille; Yeo-Johnson laajentaa
Käyttö ja valinta riippuvat datan ominaisuuksista ja mallin vaatimuksista. Monissa tapauksissa tasaisesti skaalatut ominaisuudet parantavat konvergenssia