datakäsittelymenetelmät
Datakäsittelymenetelmät ovat joukko prosesseja ja käytäntöjä, joilla data kerätään, valmistellaan, tallennetaan, integroidaan ja analysoidaan päätöksenteon tueksi. Niiden tavoitteena on muuttaa raakadata käyttökelpoiseksi informaatioksi, jota voidaan hyödyntää liiketoiminnassa, tutkimuksessa ja operatiivisissa toimissa. Menetelmät kattavat sekä pienet että suuret datamassat ja niitä sovelletaan laajasti eri toimialoilla.
Yleisessä jaossa datakäsittely voidaan jakaa viiteen pääalueeseen: datan kerääminen ja tallentaminen (keruumenetelmät, tiedonhallinta, tietovarastointi ja data-lake-tyyppiset
Käytettyjä menetelmiä ovat muun muassa kuvaileva tilastotiede, inferenssi, regressio- ja luokittelumallit, klusterointi sekä erilaiset koneoppimisen algoritmit.
Tietosuoja ja eettiset näkökohdat ovat keskeisiä: henkilötiedot ja arkaluonteiset tiedot on suojattava, anonymisointi ja minimointi ovat
Sovellukset kattavat liiketoiminnan päätöksenteon tuki, riskien ja compliance-hallinta, tuotannon optimointi, markkinatutkimus sekä tieteellinen ja teollinen tutkimus.