ETLpijplijn
Een ETL-pijplijn, ook wel ETL-pijplijn genoemd, verwijst naar het proces van Extract-Transform-Load waarbij data vanuit diverse bronnen wordt verzameld, getransformeerd naar een gestandaardiseerd schema en vervolgens geladen in een doelsysteem zoals een datawarehouse of data lake. In sommige contexten wordt gesproken van ELT (Extract-Load-Transform), waarbij transformatie pas na het laden plaatsvindt, meestal via de kracht van het doelsysteem.
De kerncomponenten zijn Extractie, Transformatie en Laden. Bij Extractie worden data uit verschillende bronnen gehaald, zoals
Architectuur en werking kenmerken. ETL-pijplijnen worden vaak orkestratiegedreven, met tools die afhankelijkheden en planning beheren (bijv.
ELT, technologieën en overwegingen. Bij ELT wordt data eerst geladen en pas getransformeerd in het doelsysteem,