skalointimenetelmät
Skalointimenetelmät ovat joukko tekniikoita, joita käytetään muuttujien tai piirteiden arvojen muuttamiseen numeeriselle skaalalle. Tavoitteena on yleensä varmistaa, että eri skaaloissa olevat muuttujat eivät dominoi analyysia tai algoritmeja, ja parantaa siten mallien suorituskykyä koneoppimisessa ja tilastollisessa analyysissä.
Yleisin skalointimenetelmä on standardointi, joka tunnetaan myös nimellä Z-pisteiden skaalaus. Standardoinnissa jokaisen muuttujan arvot muunnetaan siten,
Toinen yleinen menetelmä on normalisointi, joka tunnetaan myös nimellä min-max-skaalaus. Normalisoinnissa muuttujien arvot skaalataan tietylle välille,
Muita skalointimenetelmiä ovat esimerkiksi robusti skaalaus, joka käyttää keskilukua ja kvartiiliväliä keskiarvon ja keskihajonnan sijasta, mikä