Home

dataonzekerheid

Dataonzekerheid is de onzekerheid die aanwezig is in data en die de betrouwbaarheid ervan beperkt bij analyse en besluitvorming. Het ontstaat door meetfouten, ontbrekende waarden, inconsistenties tussen datasets en onnauwkeurigheden in data-integratie. Dataonzekerheid raakt de inhoud, tijdigheid en herkomst van data en kan optreden op het niveau van individuele waarnemingen tot hele databronnen.

Oorzaken en typen: meetfouten zoals ruis en sensorafwijkingen; steekproefgebonden fouten en missing data; foutieve transformatie en

Representatie en kwantificatie: onzekerheid wordt vaak uitgedrukt met interval- of kansverdelingen. Methoden zijn onder meer betrouwbaarheids-

Impact en aanpak: onzekerheid beïnvloedt conclusies, risicobeoordeling en operationele beslissingen. Een goede data governance met kwaliteitsmetingen,

Samenvatting: dataonzekerheid beschrijft de grenzen van wat data kunnen vertellen. Met probabilistische modellering, imputatie en gevoeligheidsanalyse

inconsistenties
in
eenheden.
Een
gangbare
indeling
is
aleatorische
onzekerheid
(door
toeval)
en
epistemische
onzekerheid
(door
beperkte
kennis
of
modelkeuzes).
Daarnaast
kan
data-drift
optreden
wanneer
de
werkelijkheid
verandert
terwijl
verzamelingsprocessen
hetzelfde
blijven.
en
kansramingen,
bootstrap,
gevoeligheidsanalyse
en
Bayesian
modellen.
Voor
ontbrekende
waarden
kan
imputatie
worden
toegepast,
vaak
als
meerdere
imputaties.
Transparante
rapportage
van
aannames
en
metadata
helpt
bij
begrip
en
communicatie
van
onzekerheid.
documentatie
van
herkomst
en
periodieke
controles
is
essentieel.
Door
onzekerheid
expliciet
te
maken
en
te
communiceren,
kunnen
organisaties
robuuste
besluiten
nemen
en
passende
veiligheidsmarges
hanteren.
kan
men
onzekerheden
kwantificeren,
communiceren
en
beperken
in
de
besluitvorming.