normalisointimenetelmät
Normalisointimenetelmät ovat tilastollisen datan esikäsittelyssä käytettyjä keinoja, joiden tavoitteena on muuttaa mittausarvoja siten, että ne ovat vertailukelpoisia sekä ominaisuuksien että havaintojen välillä. Eri mittayksiköt ja mittakaavat voivat vääristää analyysien tuloksia, ja normalisointi auttaa tasaamaan nämä erot sekä parantamaan menetelmien vertailtavuutta.
Yleisimmät menetelmät ovat esimerkiksi min–max-skalaus, z-score-normalisointi (standardisointi), logaritmimuunnos sekä kvantile-normalisointi. Min–max-skalaus muuttaa muuttujan arvot [min, max]-välille.
Robust scaling käyttää mediaania ja IQR:ää poikkeavien arvojen herkkyyden vähentämiseksi. Yksikkövektorin pituuden mukaan normalisointi, eli L2-normalisointi,
Käyttökohteita ovat koneoppimisen etukäsittely, dataintegraatio sekä genomisen datan ja kuvatiedon analyysi. Valinta riippuu datan ominaisuuksista, analyysimenetelmästä