ryhmädataa
Ryhmädataa tarkoittaa tilastotieteessä dataa, joka on jaoteltu luokkiin tai luokkamääreihin ja jonka jokaisella luokalla on frekvenssi. Tällainen esitys seuraa suuria tai yksittäisten havaintojen määrää, jolloin jokainen havainto ei esiinny erikseen, vaan luokkakohtaiset määrät kertovat jakauman muodon. Ryhmädataa käytetään usein mitta- ja voidaan käyttää kun raakadataa on liian paljon tai kun halutaan suojata yksilöiden ominaisuuksia.
Ryhmädatan rakentaminen alkaa luokkien valinnasta. Yleensä valitaan yhtä leveät luokat, joiden alaluokat ovat sulkevia ja kattavat
Tunnusluvut ja estimointi ryhmädatalle perustuvat luokkakeskusten ja frekvenssien käyttöön. Tavallisia mittauksia ovat:
- Keskiarvo: x̄ = (sum f_i m_i) / N, missä m_i on luokan i keskipiste ja f_i sen frekvenssi.
- Varianssi: s^2 ≈ (sum f_i m_i^2)/N − x̄^2 (tai käytettäessä näytteen varianssia s^2 = (sum f_i m_i^2)/N−1 jaoteltuna).
- Mediaani: etsitään luokka, jonka kumulatiivinen frekvenssi ylittää N/2; medianin arvioinnissa käytetään luokan alarajaa L, levyä w
- Moodi: modaalinen luokka (suurin frekvenssi).
Ryhmädatan suurin etu on yksinkertainen ja tehokas kuvaus suuremmista aineistoista; sen haittoja ovat informaation kato ja