Datasarjojen
Datasarjojen on tilastotieteessä ja data-analyysissä käytetty termi, jolla viitataan datakokonaisuuteen. Datasarja koostuu havainnoista; tavallinen esitys on taulukko, jossa rivit vastaavat yksittäisiä havaintoja ja sarakkeet muuttujia. Datasarjoja voidaan luokitella yksimuuttujaisiin (yksi muuttuja per havainto) ja monimuuttuaisiin (useita muuttujia per havainto). Erityinen laji on aikasarja, jossa havainnot kerätään ajanhetkittäin.
Rikkaamman kuvan datasarjasta antaa metatieto: muuttujien nimet, mittakaava, ajanjakso sekä mittausten yksikkö. Datasarjojen sijainti voi olla
Datasarjojen analyysi sisältää tilastollisten menetelmien soveltamisen, kuvaamisen ja mallintamisen. Ennen analyysiä suoritetaan esikäsittely: puuttuvien arvojen hoitaminen,
Etikasta ja tietosuoja on aina huomioitavaa, kun datasarjoihin sisältyy henkilötietoja. Anonymisointi ja pääsyhallinta auttavat suojaamaan yksilöiden