epästrukturoituja
Epästrukturoituja aineistoja tarkoittaa dataa, jota ei ole järjestetty ennalta määriteltyyn rakenteeseen, kuten taulukkoihin tai relaatiomalliin. Tämänkaltaisen datan analysointi ja käsittely on usein vaikeampaa perinteisillä tietokannoilla, ja se vaatii erilaisia menetelmiä sekä prosesseja.
Esimerkkejä epästrukturoituneista aineistoista ovat teksti- ja sähköpostiviestit, asiakaspalautteet, sosiaalisen median julkaisut sekä mediasisällöt kuten kuvat, videot
Ominaisuudet ja haasteet: data on heterogeenista ja helposti skaalaantuu suuriksi määriksi. Skeeman puuttuminen vaikeuttaa tiedon yhdistelemistä,
Käsittely ja tallennus: epästrukturoituja aineistoja säilytetään usein datalakeissa tai pilvitallennusvarastoissa, joihin lisätään metadata sekä luokittelu. Analyysissä
Sovelluksia ovat esimerkiksi asiakaspalautteen ja sosiaalisen median analytiikka, yritysten sisällönhallinta sekä terveydenhuollon kliinisten muistioiden jäsentäminen sekä