Datastrømmer
Datastrømmer er kontinuerlige, uendelige sekvenser av datapunkter som genereres over tid. Hvert element representerer vanligvis en hendelse, en måling eller en oppdatering og har ofte et tidsstempel. Datastrømmer skiller seg fra tradisjonelle batchdata ved at de kommer inn fortløpende og ofte må behandles med lav latens.
Viktige kjennetegn ved datastrømmer er hastighet (velocity), volum (volume), variasjon (variety), pålitelighet/sannhet (pålitelighet) og verdi (value).
Arkitektur og komponenter innebærer vanligvis produsenter som genererer data, et meldingssystem eller temaer/broker som fungerer som
Bruksområder omfatter sanntidsanalyse og overvåking, varsling ved anomalies, svindeldeteksjon, IoT-sensorer og klikkstrømmer på nettet, samt kontinuerlig
Utfordringer inkluderer opprettholdelse av riktig rekkefølge, håndtering av forsinket data, backpressure, skjemamigrasjoner og datakvalitetskontroll, samt sikkerhet