skaalausmenetelmistä
Skaalausmenetelmät, suomeksi skaalausmenetelmät, viittaavat joukkoon tekniikoita, joita käytetään datan tai parametrien muuntamiseen tietylle välille tai jakautumalle. Tämä on yleinen esikäsittelyvaihe monissa koneoppimisen ja data-analyysin algoritmeissa. Skaalaus on tärkeää, koska monet algoritmit ovat herkkiä syötteen arvojen suuruudelle. Jos erikokoisia ominaisuuksia ei skaalata, suuremman arvovälin omaavat ominaisuudet voivat dominoida prosessia, mikä voi johtaa huonompaan suorituskykyyn tai epätarkkoihin tuloksiin.
Yleisimpiä skaalausmenetelmiä ovat normalisointi ja standardointi. Normalisoinnissa, jota kutsutaan myös min-max-skaalaukseksi, data muunnetaan tyypillisesti välille 0
Muita skaalausmenetelmiä ovat esimerkiksi robusti skaalaus, joka käyttää mediaania ja kvartiileja, mikä tekee siitä vähemmän herkän