epästrukturoidusta
Epästrukturoitu tieto, tai epästrukturoitunut data, tarkoittaa tietoa, jolla ei ole ennalta määriteltyä skeemaa tai kiinteää rakennetta. Tiedot ovat usein osittain vapaamuotoisia tai monimuotoisia, eikä niitä ole järjestetty taulukkomuotoon samalla tavalla kuin perinteiset relaatiotietokannat.
Esimerkkejä epästrukturoidusta tiedosta ovat tekstidokumentit, sähköpostit, chat-viestit, blogi- ja uutisartikkelit, sosiaalisen median julkaisut sekä äänilähteet, videot
Ominaisuuksiin kuuluu muotojen, kielten ja kontekstien suuri variaatio sekä usein puutteellinen tai epäyhtenäinen metatieto. Tämä tekee
Käsittelyyn käytetään usein data-lake-arkkitehtuureja sekä teknologioita kuten Hadoop tai Apache Spark, ja niihin liittyy OCR-tekniikkaa, seurauksena
Käyttökohteita ovat esimerkiksi dokumenttien hallinta, asiakas- ja sisällöntuotannon analyysi sekä riskienhallinta ja vaatimustenmukaisuus. Epästrukturoitu tieto tarjoaa