datavolatiliteit
Datavolatiliteit verwijst naar de variabiliteit van datawaarden in de loop van de tijd of tussen steekproeven. Het kan ontstaan door veranderingen in het onderliggende proces, meetfouten, of door gewijzigde dataverzamelingsmethoden en externe factoren. Volatiliteit is een kenmerk van onzekerheid in data en heeft gevolgen voor analyses en modellen die op die data rusten.
Oorzaken omvatten conceptdrift (veranderingen in de relatie tussen input en output over tijd), seizoenale patronen, wijziging
Metingen van datavolatiliteit omvatten statistische maten zoals variantie en standaarddeviatie, maar ook drift- en veranderingmetingen zoals
De gevolgen van significante datavolatiliteit zijn modelleringverval, verslechterde voorspelprestaties en foutieve beslissingen. Omvat monitoring, data governance
Zie ook: concept drift, data drift, data quality, data provenance, tijdreeksanalyse.