Home

datakilde

Datakilde er enhver kilde, der leverer data, som anvendes af systemer, analyseværktøjer eller beslutningsstøttesystemer. Begrebet bruges bredt inden for informationsteknologi og dataforskning og omfatter både operationelle data og analytiske datasæt. En datakilde kan være intern, såsom virksomhedens ERP- eller CRM-systemer, logfiler og transaktionsdatabaser, eller ekstern, som offentlige registre, open data-portaler, tredjepartsdata og sociale medier. Data fra en datakilde kan leveres i realtid eller i batch og kan være struktureret, semistruktureret eller ustruktureret.

Formater og typer: Strukturerede kilder som relationelle databaser og regneark; semistrukturerede som JSON og XML; ustrukturerede

Kvalitet, sporbarhed og metadata: Det er almindeligt at dokumentere datakildens oprindelse, opdateringsfrekvens, format, rettigheder og kvalitet.

Anvendelse og styring: Datakilder bruges i data integration, ETL/ELT-processer, business intelligence, data governance og dataforskning. Styres

som
dokumenter,
billeder
eller
video.
Adgang
kan
ske
via
databaser,
API’er
eller
filudveksling,
og
datakilder
kan
kræve
autentificering,
tilgange
og
licensvilkår.
Data
lineage
(stamtræ
for
data),
provenance
og
versionering
gør
det
muligt
at
spore,
hvordan
data
er
blevet
ændret
og
hvornår.
Metadata
spiller
en
central
rolle
i
datasamarbejde,
især
ved
dataintegration
og
data
governance.
gennem
datastyringspolitikker,
adgangskontrol
og
licensbetingelser.
Behandling
af
personoplysninger
følger
gældende
lovgivning
(f.eks.
GDPR),
og
det
er
normalt
at
implementere
sikkerhedsforanstaltninger
og
aftaler
om
databrugsret.