förändringsdatahämtning
Förändringsdatahämtning (CDC) är en metod för att identifiera och överföra ändringar som görs i en källdatabas eller annan datakälla till en målplattform i realtid eller nära realtid. CDC fokuserar på händelser som INSERT, UPDATE och DELETE och möjliggör kontinuerlig synkronisering utan att behöva läsa hela databasen vid varje uppdatering.
Vanligtvis består en CDC-pipeline av tre steg: fångst av förändringar i källan (capture), transport av förändringshändelser
Tekniker och verktyg inom CDC inkluderar Debezium (öppen källkod, byggt på Kafka), Oracle GoldenGate, SQL Server
Fördelar inkluderar låg latens i överföring av förändringar, minskat behov av fullständiga laddningar, förbättrad audit- och
Användningsområden inkluderar realtids- eller near real-time-analys i data warehouses och lakehouses, kontinuerlig synkronisering mellan system samt