normalisointimenetelmien - Infinite Lexicon - Infinite Lexicon

normalisointimenetelmien

Normalisointimenetelmien tarkoituksena on muuttaa muuttujien mittakaavat vertailukelpoisiksi, jotta data soveltuu paremmin tilastolliseen analyysiin sekä koneoppimismalleihin. Ilman asianmukaista skaalautumista erilaiset ominaisuudet voivat vaikuttaa mallien oppimiseen epätasaisesti, erityisesti etäisyyksiin ja lineaarisuuteen perustuvissa menetelmissä.

Yleisimmät lähestymistavat ovat min-max-normalisointi, standardisointi ja robust scaling. Min-max-normalisoinnissa uusi arvo on x' = (x − min(X)) / (max(X)

Laajemmasta muunnosvalikoimasta löytyvät logaritmimuunnokset sekä muunnokset Box-Cox ja Yeo-Johnson. Box-Cox on tarkoitettu positiivisille arvoille; Yeo-Johnson laajentaa

Käyttö ja valinta riippuvat datan ominaisuuksista ja mallin vaatimuksista. Monissa tapauksissa tasaisesti skaalatut ominaisuudet parantavat konvergenssia

−

Standardisoinnissa

=

−

μ)/σ,

=

−

/

ei-positiivisiin

rank-normalisointi

tulkittavuutta.

testijoukkoihin