Home

batchbehandling

Batchbehandling er en metode til at behandle en samling opgaver eller data som en samlet enhed uden direkte brugerindgriben under selve behandlingen. Ordet anvendes især inden for databehandling og industriel produktion og omfatter både ældre mainframe-miljøer og moderne cloud-baserede systemer. Formålet er at maksimere gennemløb og ressourceudnyttelse ved at køre en række lignende jobs sammen uden interaktivitet.

Et batch-job består typisk af inputdata, en batch-kørende program eller script, og en output-/resultatproces. Jobene lægges

Sammenlignet med realtids- eller stream-behandling accepterer batchbehandling længere ventetid og højere gennemløb per kørsel, men med

Anvendelser omfatter lønpålægning, månedlig fakturering, ETL-processer i datavarehuse, rapportgenerering og dataarkivering. Værktøjer og teknologier til batchbehandling

Historisk var batchbehandling centralt i store mainframe-miljøer og COBOL/JCL, men konceptet lever videre i skybaserede og

i
en
kø
og
køres
af
en
batch-scheduler
eller
orkestrator,
ofte
i
sekventiel
rækkefølge
eller
parallelt
hvor
det
er
muligt.
Under
udførelsen
kan
der
være
checkpointing
og
logning
for
fejlbehandling
og
genoptagelse.
Batchbehandling
passer
godt
til
opgaver
som
kan
forsinkes
og
uden
umiddelbar
brugerinteraktion.
større
latency
for
nye
data.
Fordelene
inkluderer
høj
gennemløb,
konsistens
og
forudsigelig
ressourceanvendelse,
mens
udfordringer
omfatter
forsinket
feedback,
fejlgenopretning
og
vedligeholdelse
af
kø-strukturer.
spænder
fra
traditionelle
cron
eller
Windows
Task
Scheduler
til
moderne
workflow-
og
orkestreringssystemer
som
Apache
Airflow,
Apache
Spark
i
batch-tilstand,
AWS
Batch
og
lignende.
distribuerede
miljøer
via
batch-workflows
og
planlægningssystemer.
Kvalitative
krav
til
idempotens,
reproducerbarhed
og
sikkerhed
er
vigtige
i
moderne
implementeringer.