raakadatasta
Raakadata tarkoittaa dataa, joka on kerätty suoraan alkuperäisestä lähteestä ilman esikäsittelyä, muokkauksia tai aggregointeja. Esimerkkejä raakadatan lähteistä ovat sensorien mittausarvot, järjestelmälogit, kyselyiden vastausjoukot, kuvat, äänitallenteet sekä verkkopalvelujen tapahtumalokit ja käyttödata. Raakadata kuvaa alkuperäiset mittaukset ja tapahtumamuutokset sellaisinaan kuin ne on tallennettu.
Raakadatan ominaisuuksiin kuuluvat suuri määrä, monimuotoisuus ja nopea kertymisvauhti. Dataa kertyy nopeasti ja sen laatu voi
Raakadatan rooli data-analyyseissä on perustavanlaatuinen: se toimii lähtöaineena, josta kehitetään puhtaita datavarastoja sekä koulutusaineistoja. Läpinäkyvyys ja
Raakadataan liittyy myös haasteita ja vastuukysymyksiä, kuten yksityisyys, tietosuoja ja eettisyys. On tärkeää ylläpitää datan provenance-