datapoolernas
Datapoolerna är samlingar av data som centraliseras och förvaltas för återanvändning över applikationer, utveckling, analys och test. De består ofta av data från olika källor som produktion, externa leverantörer och syntetiskt genererade dataset. Syftet är att skapa tillgänglig, kvalitetssäkrad data som kan återanvändas utan att behöva duplicera ansträngningar varje gång.
Typiska datapooler inkluderar operationella datapooler (baserade på rådata från affärssystem), analytiska datapooler (för BI och maskininlärning),
Arkitektur och förvaltning: Inhämtning och ETL/ELT, lagring i data lake eller data warehouse, kataloger och metadata,
Styrning och integritet: Dataskydd, anonymisering, accesskontroller, rollbaserad behörighet och överensstämmelse med regler som GDPR. Data governance
Fördelar och utmaningar: Fördelarna inkluderar enhetlig tillgång till data, snabbare utveckling, bättre konsistens och möjligheter till
Relationer: datapoolerna kan komplettera eller ersätta enskilda datalager som datawarehouse; de kan samverka med data marketplaces