Epästrukturoitua
Epästrukturoitua dataa tarkoitetaan dataa, jolla ei ole ennalta määriteltyä rakennetta tai skeemaa. Tällainen data ei sovellu helposti tavallisiin relaatiotietokantoihin, joissa tiedot ovat riveissä ja sarakkeissa. Epästrukturoitu data muodostuu usein vapaan tekstin, multimedia-aineistojen sekä muun kontekstiriippuvaisen sisällön muodossa, ja sen sisältö voi olla hankalasti tulkittavaa ilman lisäanalyysiä.
Epästrukturoidun datan analysointi ja hyödyntäminen edellyttää usein erikoistekniikoita, kuten luonnollisen kielen käsittelyä (NLP), puheentunnistusta, kuvantunnistusta sekä
Esimerkkejä epästrukturoidusta datasta ovat vapaa-tekstiset asiakasarvostelut, sähköpostit, sosiaalisen median julkaisut, mediasisällöt kuten kuvat ja videot sekä
Käytännössä epästrukturoitua dataa käsitellään usein datalake-tyyppisissä ympäristöissä, joissa data säilytetään muuttumattomana ja lisätiedot mukaan liitetään vasta