Home

databron

Een databron is, in informatica en datawetenschap, elke bron waaruit data wordt gehaald voor verwerking, opslag of analyse. Een databron kan intern zijn, zoals een relationele database of een bestand op een bedrijfsserver, of extern, zoals een publieke API of een cloudservice. Databronnen leveren data in verschillende vormen, waaronder gestructureerde datasets (tabellen), semi-gestructureerde formaten (JSON, XML) en ongestructureerde content (tekst, afbeeldingen). Ze kunnen statisch zijn, bijvoorbeeld gecachte bestanden, of streaming, zoals sensordata of berichten in een berichtensysteem.

In data-integratie en analyse worden databronnen samengebracht via ETL/ELT-pijplijnen, datawarehousing, data lakes of data-virtualisatie. Het begrip

Belangrijke overwegingen zijn onder meer authenticatie en autorisatie voor toegang, naleving van privacy en licenties, latentie

Voorbeelden zijn een SQL-database als databron voor een rapportage-omgeving, een JSON-API die live voorraadgegevens levert, of

data-provenance
of
data-herkomst
verwijst
naar
het
traceren
van
de
oorsprong
van
data,
de
bewerkingen
die
eraan
zijn
gedaan
en
de
kwaliteit
van
de
gegevens.
en
actualiteit
van
data,
en
metadata
die
de
bruikbaarheid
vergroot.
Bij
het
ontwerp
van
informatiesystemen
wordt
vaak
rekening
gehouden
met
databronnen
op
basis
van
betrouwbaarheid,
beschikbaarheid
en
onderhoudbaarheid.
een
CSV-bestand
met
historische
verkoopdata.
In
open
data-projecten
kunnen
databronnen
bestaan
uit
publieke
datasets,
sensordata
of
web-scraped
content.