datagenereren
Datagenereren is het proces van het creëren of samenstellen van gegevens voor gebruik in analyse, modellering, simulatie of testing. Het kan zowel betrekking hebben op het genereren van synthetische data als op het omzetten en combineren van bestaande data. Synthetische data zijn kunstmatig geproduceerde records die statistisch overeenkomen met een doeldataset zonder identificeerbare informatie te onthullen.
Methoden voor datageneratie variëren van statistische en computer-gegenereerde technieken tot modellering. Voorbeelden zijn random sampling, bootstrapping
Doeleinden van datageneratie zijn onder meer het testen en valideren van data pipelines en software, het trainen
Toepassingsgebieden omvatten onder meer gezondheidszorg, financiën, verkeer en logistiek, telecommunicatie en klimaat- en milieumodellering. Bij datageneratie