Home

Ustrukturerede

Ustrukturerede data betegner information, som ikke følger et foruddefineret skema eller en fast struktur. Sådan data kommer ofte i form af tekstfiler, e-mails, sociale medieindlæg, billeder, lyd og video samt rå sensor- og logdata. Modsat strukturerede data, der normalt optræder i tabeller og databaser med veldefinerede kolonner, kræver ustrukturerede data særlige metoder og værktøjer for at kunne forstås og analyseres.

Behandling og analyse af ustrukturerede data indebærer ofte forberedelse og fortolkning, herunder schema-on-read, metadata og tagging

Anvendelser og udfordringer ved ustrukturerede data er brede. De spiller en central rolle i kundeindsigt, dokumentanalyse,

I praksis kombineres ustrukturerede data ofte med strukturerede data i hybride arkitekturer som data lakes og

samt
anvendelse
af
teknikker
inden
for
naturlig
sprogbehandling,
computer
vision
og
talegenkendelse.
Dataene
må
indekseres
og
ofte
gemmes
i
data
lakes
eller
lignende
arkitekturer,
hvor
de
senere
kan
analyseres
af
maskinlæringsmodeller
eller
gennem
menneskelig
gennemlæsning.
Effektiv
håndtering
kræver
også
data
governance,
kvalitetssikring
og
sikkerhedspraksisser.
medicinske
journaler
og
juridiske
dokumenter,
hvor
de
giver
rig
information,
men
samtidig
udfordrer
søgning,
standardisering
og
overholdelse
af
regler.
Særligt
krav
til
persondata
og
fortrolighed
kræver
omhyggelig
håndtering
og
sporbarhed.
data-lakehouses.
Moderne
analyseværktøjer
og
skalerbare
beregningsrammer
i
skyen
muliggør
større
udnyttelse
af
ustrukturerede
informasjonskilder,
drevet
af
fremskridt
inden
for
NLP,
computer
vision
og
big
data-teknologier.