ETLtyönkulut
ETL-työnkulut (ETL workflows) ovat data- ja integraatiojärjestelmissä käytettyjä prosessien sarjoja, jotka hallinnoivat tiedon liikettä lähteestä kohteeseen. Niissä data kerätään (extract), muunnetaan (transform) ja ladataan (load) data warehouseen, data-lakeen tai muuhun analyysikokonaisuuteen. Työnkulut voivat olla eräajettuja (batch) tai reaaliaikaisia (streaming) ja ne voivat koostua useista riippuvuuksista, ehtolausekkeista ja aikatauluista.
Työnkulut toteutetaan yleisesti ETL-työkaluilla eli ohjelmistokomponenteilla, joiden avulla data-virtoja suunnitellaan, ajoitetaan ja valvotaan. Tavallisimpia ympäristöjä ovat
ETL-työnkulkujen suunnittelussa korostuvat data-laadun varmistaminen, skeeman evoluutio sekä ajastuksen hallinta. Hyödyllisiä käytäntöjä ovat inkrementaaliset lataukset, muuttuvien
ETL-työnkulkujen tavoitteena on luotettava, skaalautuva ja toimitusvarma datan toimitus analytiikalle, samalla huomioiden turvallisuus, tietosuoja ja kustannukset