unstrukturert
Unstrukturert data beskriver data som ikke følger et forhåndsdefinert skjema eller modell. I motsetning til strukturert data, som ligger i tabeller og kan forespørres med SQL, mangler unstrukturert data ofte entydig struktur. Eksempler inkluderer tekstdokumenter, e-poster, bilder, lyd- og videofiler, samt sosiale medier-innlegg og andre filer uten standardisert format.
Kjennetegn inkluderer heterogenitet i innhold og form, store volumer, varierende kvalitet og ofte fravær av metadata.
Bruksområder omfatter søk og innholdsanalyse, dokumenthåndtering, rettsmedisinsk eDiscovery, sentimentanalyse av kundekommentarer, medisinske notater, bildedannelse og videoanalyse,
Behandling og analyse krever teknikker som naturlig språkbehandling (NLP), optisk tegngjenkjenning (OCR), bilde- og taleanalyse, og
Forholdet til strukturert og semi-strukturert data: strukturert data gir presise spørringer, mens unstrukturert data ofte må