databewerking
Databewerking is het proces waarbij ruwe gegevens worden omgezet in bruikbare informatiesets voor analyse, rapportage en besluitvorming. Het omvat alle handelingen van verzamelen tot presenteren en kan zowel gestructureerde als ongestructureerde data betreffen. In de praktijk gaat databewerking verder dan puur invoeren: het omvat data cleaning, deduplicatie, normalisatie, transformatie en integratie van gegevens uit verschillende bronnen, zodat consistente en verifieerbare datasets ontstaan.
Belangrijke activiteiten binnen databewerking zijn onder meer data acquisitie, validatie en kwaliteitsborging; data cleaning (verwijderen of
Architectuur en aanpak variëren, met batchverwerking en streaming/real-time verwerking als veelvoorkomende modellen. Veelgebruikte processen zijn ETL
Kwaliteit, beveiliging en regelgeving zijn centrale aandachtspunten: data governance en kwaliteitsmetingen met auditable processen, naast privacy-