Datavergaring
Datavergaring is het proces van het verzamelen, vastleggen en bewaren van gegevens uit verschillende bronnen ten behoeve van analyse, rapportage of archivering. Het omvat het identificeren van relevante databronnen, het verkrijgen van data en het opslaan ervan in systemen zoals databases, data lakes of datawarehouses, met aandacht voor toegankelijkheid voor geautoriseerde gebruikers.
Het vormt een schakel tussen dataverzameling en datagebruik en is nauw verwant aan data-integratie, dataopslag en
Processtappen binnen datavergaring omvatten doeldefiniëring, bronkeuze, extractie (ETL/ELT), transformatie en normalisatie, kwaliteitscontrole en metadatabeheer (bijvoorbeeld provenance).
Technologieën en formats die vaak voorkomen zijn relationele en NoSQL-databases, data lakes en datawarehouses, API's, sensoren