Datenfolgen
Datenfolgen bezeichnen eine geordnete Menge von Messwerten oder Beobachtungen, die in einer bestimmten Reihenfolge aufgenommen wurden. Der Index t kennzeichnet die Position in der Folge, oft Zeitpunkte t = 1,...,N, wodurch sie als zeitliche Folge (Time Series) interpretiert wird; Daten können aber auch räumlich oder kategorial geordnet auftreten. Eine Datenfolge kann univariate oder multivariate Messungen enthalten.
Wesentliche Merkmale sind Trend, Saisonalität, Rauschen und Abhängigkeiten zwischen den Beobachtungen. Autokorrelation beschreibt diese Abhängigkeiten. Stationarität
Die Analyse umfasst Visualisierung, Glättung und Zerlegung in Trend-, Saison- und Restkomponente, sowie Modellierung und Prognose.
Herausforderungen sind fehlende Werte, unregelmäßiges Sampling, Messfehler und Ausreißer. Daten werden üblicherweise in CSV-Dateien, relationalen oder
Anwendungsbereiche reichen von Finanzen, Meteorologie und Ingenieurwesen bis zu Sensorik und Nutzungsanalyse. Formal kann eine Datenfolge