datafouten
Datafouten zijn foutieve of onvolledige gegevens die voorkomen in datasets, databases of informatiesystemen. Ze kunnen ontstaan bij registratie, import, migratie of via automatische processen en variëren van kleine fouten tot significante inconsistenties tussen systemen. Veelvoorkomende vormen zijn onjuist ingevoerde waarden, ontbrekende velden, duplicaten, verouderde informatie en tegenstrijdige records.
De impact van datafouten kan omvangrijk zijn. Foute data leiden vaak tot verkeerde analyses, misleidde besluitvorming,
Oorzaken van datafouten zijn onder andere menselijke fouten bij invoer, software- of parsingfouten, integratieproblemen tussen systemen,
Detectie en preventie vullen elkaar aan. Detectiemethoden omvatten validatieregels, data profiling, anomaliedetectie en reconciliatie tussen gerelateerde
Kwaliteitsdimensies geven houvast bij evaluatie: nauwkeurigheid, volledigheid, consistentie, actualiteit, geldigheid en integriteit. In organisaties is dataquality