dataanalyslivscykeln
Dataanalyslivscykeln är en systematisk process som beskriver hur data används för att skapa affärsnytta. Den går från initial problemformulering till implementering av lösningar och uppföljning av resultat. Processen är tvärfunktionell och kräver samarbete mellan domänexpertis, dataingenjörer och dataanalytiker.
Vanliga faser är: problemformulering och mål; insamling och åtkomst till relevanta datakällor; datarengöring och förberedelse; bedömning
Livscykeln är oftast iterativ och icke-linjär; feedback från utvärdering eller ny data kan leda tillbaka till
Vanliga artefakter är problemformulering, dataflöden och dokumentationsförklaringar, datakataloger, dataförberedelseloggar, modeller och valideringsrapporter, samt deployments, drifts- och
Kvalitet och styrning är centrala: spårbarhet och reproducerbarhet av analyser, dataintegritet och sekretess, samt efterlevnad av