Outlierhallinta
Outlierhallinta, tai poikkeamien hallinta, viittaa tilastollisiin ja datananalyysimenetelmiin, joilla tunnistetaan ja käsitellään datan joukossa olevia poikkeuksellisia arvoja. Poikkeamat ovat arvoja, jotka poikkeavat selvästi muista datapisteistä ja voivat vaikuttaa negatiivisesti mallien suorituskykyyn tai päätöksentekoon. Niiden tunnistaminen ja käsittely on tärkeää monissa sovelluksissa, kuten taloustieteessä, lääketieteessä, tekoälymallien koulutuksessa ja laadunvalvonnassa.
Poikkeamien tunnistamiseen käytetään erilaisia menetelmiä, kuten z-kertoimen, IQR (interquartile range) -menetelmän tai pääkomponenttianalyysin avulla. Z-kerroin mittaa
Poikkeamien käsittely voi tapahtua poistamalla ne kokonaan, korvaamalla ne keskiarvolla tai muulla sopivalla arvolla, tai käyttämällä
Outlierhallinta on tärkeä osa datan puhdistusta ja esikäsittelyä, sillä puhdas ja luotettava data on perusta luotettaville