dataforarbejdning
Dataforarbejdning er behandlingen af data gennem en række operationer, der gør rå data brugbare til beslutninger og drift. Det omfatter indsamling, opbevaring, rensning, validering, integration og transformation af data samt formidling gennem rapporter, dashboards eller andre downstream-systemer.
Typiske faser i dataforarbejdning inkluderer dataindsamling fra kilder, rensning og kvalitetssikring, berigelse og transformation (ETL eller
Dataforarbejdning kan ske i batch eller i realtid/streaming. Den kræver data governance, metadata, sporbarhed (data lineage)
Anvendelsesområderne spænder fra erhvervsliv og offentlig sektor til forskning. Outputtene er ofte beslutningsstøttende rapporter, dashboards eller