Datananalyysi
Datananalyysi on prosessi, jossa kerättyä dataa tarkastellaan, puhdistetaan ja muokataan, jotta siitä saadaan tietoa päätöksenteon tueksi. Siinä yhdistyvät tilastolliset menetelmät, tiedon louhinta ja datan tulkinta. Datananalyysi voi sisältää kuvailevaa analyysiä sekä diagnostista, ennustavaa ja preskriptiivistä analyysiä.
Työnkulku alkaa tavoitteiden määrittelystä, jonka jälkeen kerätään ja yhteen sovitetaan relevantteja tietolähteitä. Datan puhdistaminen, virheiden korjaaminen
Yleisimmät menetelmät ovat tilastollinen kuvaileva ja inferenssianalyysi, regressio, luokittelu, klusterointi sekä aika sarja -ennusteet. Deskriptiivinen ja
Haasteisiin kuuluvat datan laatu, vinoumat sekä tietosuoja ja lainsäädäntö, kuten GDPR. Datan hallinta, eettisyys ja mallien