datajakauman
Datajakauma on tilastotieteellinen käsite, joka kuvaa, miten datan arvot jakautuvat havaintoainesarjassa. Datajakaumaa voidaan tarkastella kahdella tavalla: empiirisellä jakaumalla, joka perustuu havaintoihin ja jota esitetään usein histogrammilla, tiheyskäyrällä tai kvantileillä, sekä teoreettisella jakaumalla, jota käytetään tilastollisena mallina, kuten normaalijakauma, tasajakauma tai Poisson-jakauma. Empiirinen jakauma kuvaa todellista aineistoa, kun taas teoreettinen jakauma mallintaa ilmiötä ja mahdollistaa laskut sekä ennusteet.
Jakauman keskeisiä ominaisuuksia ovat sijainti, vaihtelu ja muoto. Sijaintia kuvaavat mittarit kuten keskiarvo ja mediaani, vaihtelua
Yleisimmät jakaumat ovat normaalijakauma, tasajakauma, binomijakauma, Poisson-jakauma ja eksponentiaalijakauma. Jakauman luonne vaikuttaa tilastollisten menetelmien valintaan: parametrisissa