zscorenormalisering
Zscorenormalisering, ook wel standardisatie genoemd, is een methode om numerieke kenmerken van data zodanig te herschalen dat ze een gemiddelde van nul en een standaardafwijking van één hebben. De transformatie gebruikt de formule z = (x − μ) / σ, waarbij μ het gemiddelde van de datareeks en σ de standaarddeviatie is. In de praktijk worden μ en σ berekend op de trainingsverzameling en daarna toegepast op zowel trainings- als testdata. Door de kenmerken op deze manier te centreren en te schalen, worden ze beter vergelijkbaar waardoor algoritmen die afhankelijk zijn van de schaal van de invoer sneller en stabieler kunnen leren.
Zscorenormalisering wordt veel toegepast bij algoritmen die gevoelig zijn voor de schaal van de kenmerken of
Let op beperkingen: ze is gevoelig voor uitbijters, die de standaarddeviatie verhogen en z-scores scheef kunnen