BatchDaten
Batchdaten bezeichnen Datensätze, die aus definierten Zeiträumen stammen und in regelmäßigen oder ad hoc geplanten Durchläufen gemeinsam verarbeitet werden. Im Gegensatz zu Echtzeit- oder Streaming-Daten werden Batchdaten gewöhnlich gesammelt, zunächst gespeichert und erst in einem oder mehreren Durchläufen transformiert, angereichert und in Zielsysteme wie Data Warehouses, Data Lakes oder Data Marts geladen.
Zu den Merkmalen gehören zeitliche Konsolidierung, deterministische Verarbeitung, hohe Datenvolumen pro Durchlauf und eine verzögerte Verfügbarkeit
Quellen für Batchdaten reichen von Transaktionslogs über Abrechnungs- und Bestandsdaten bis hin zu Messdaten, Logdateien oder
Zu den Vorteilen gehören Skalierbarkeit, Reproduzierbarkeit und Eignung für große Datenmengen. Nachteile sind Latenz und fehlende