Home

IQRmenetelmän

IQR-menetelmä on tilastollinen menetelmä havaintoja poikkeavuuksien tunnistamiseen käyttämällä interkvartiliväliä (IQR). IQR mittaa datajoukon keskialueen leveyden, sillä IQR määritellään Q1:n (25. prosenttipiste) ja Q3:n (75. prosenttipiste) erona: IQR = Q3 − Q1. Menetelmä on suhteellisen robusti äärimmäisten arvojen suhteen ja soveltuu erityisesti ei-normaalisti jakautuneisiin aineistoihin.

Laskenta etenee seuraavasti: ensin lasketaan Q1 ja Q3 sekä IQR. Sitten määritellään rajat: alaraja = Q1 − 1.5

Välineinä IQR-menetelmää käytetään usein laatikkodiagrammissa (boxplot), jossa viiksien ja laatikon rajat osoittavat IQR:n sekä 1.5×IQR:n ja

Rajoitukset ja soveltuvuus: IQR-menetelmä tarkastelee vain yhden muuttujan arvoja, joten se ei automaattisesti havaitse monimuuttujaisia poikkeavuuksia.

×
IQR
ja
yläraja
=
Q3
+
1.5
×
IQR.
Arvot,
jotka
sijoittuvat
näiden
rajojen
ulkopuolelle,
ovat
potentiaalisia
poikkeavia
arvoja.
Käytännössä
1.5
×
IQR:n
kriteeri
on
yleisesti
käytetty,
ja
3
×
IQR
voi
erottaa
äärimmäisiä
havaintoja
kutsuttuja
poikkeavia
arvoja.
mahdollisesti
3×IQR:n
perusteella
määritetyt
rajat.
Poikkeavat
arvot
voivat
kertoa
mittausvirheistä,
harvinaisista
tapahtumista
tai
datan
rakenteesta
johtuvista
erillisyyksistä.
Menetelmä
on
hyödyllinen
aineiston
puhdistuksessa
ja
esikäsittelyssä.
Pienellä
tai
suurella
otoskoolla
kvartaalien
estimaatit
voivat
vaihdella,
mikä
vaikuttaa
tulkintaan.
Muita
lähestymistapoja
poikkeavien
arvojen
havaitsemiseksi
ovat
esimerkiksi
z-säännöt
tai
multivariaatteja
huomioivat
menetelmät,
kuten
Mahalanobis-etäisyys.