Home

unstrukturert

Unstrukturert data beskriver data som ikke følger et forhåndsdefinert skjema eller modell. I motsetning til strukturert data, som ligger i tabeller og kan forespørres med SQL, mangler unstrukturert data ofte entydig struktur. Eksempler inkluderer tekstdokumenter, e-poster, bilder, lyd- og videofiler, samt sosiale medier-innlegg og andre filer uten standardisert format.

Kjennetegn inkluderer heterogenitet i innhold og form, store volumer, varierende kvalitet og ofte fravær av metadata.

Bruksområder omfatter søk og innholdsanalyse, dokumenthåndtering, rettsmedisinsk eDiscovery, sentimentanalyse av kundekommentarer, medisinske notater, bildedannelse og videoanalyse,

Behandling og analyse krever teknikker som naturlig språkbehandling (NLP), optisk tegngjenkjenning (OCR), bilde- og taleanalyse, og

Forholdet til strukturert og semi-strukturert data: strukturert data gir presise spørringer, mens unstrukturert data ofte må

Dette
gjør
søk,
analyse
og
integrasjon
vanskeligere
sammenlignet
med
tradisjonelt
strukturerte
data.
samt
automatisering
av
arbeidsprosesser
gjennom
maskinlæring
og
naturlig
språkbehandling.
maskinlæring
for
mønstergjenkjenning.
Data
lagres
ofte
i
data
lakes
og
berikes
med
metadata
og
tagging
for
å
lette
søk
og
videre
behandling.
transformeres
eller
kombineres
med
metadata
for
å
gjøre
analyse
mulig.
Semi-strukturert
data
som
JSON
eller
XML
ligger
mellom
disse
endene.