Home

Diffusionmodellen

Diffusionmodellen zijn generatieve modellen die realistische data kunnen produceren door een gefaseerd ruis- en herstelproces te modelleren. Ze leren een reeks ruisstappen toe te passen op een datapunt en hoe die ruis stap voor stap verwijderd kan worden om een nieuwe, plausibele instantie te reconstrueren.

Het proces bestaat uit een forward diffusion, waarbij data x0 via T stappen geleidelijk wordt verstoord met

Belangrijke varianten zijn DDPM (Denoising Diffusion Probabilistic Models), DDIM (deterministische variant) en score-based diffusie-modellen. Latent diffusion

Toepassingen zijn onder meer text-to-image generatie, beeldbewerking en audio- of videogeneratie. Diffusionmodellen leveren doorgaans hoge afbeeldingkwaliteit

Historisch gezien ontstonden diffusionmodellen uit onderzoeken naar probabilistische modellering in de jaren 2010, met vroege werken

ruis
totdat
xT
vrijwel
pure
ruis
is,
en
een
omgekeerde
transformatie
p_theta(x_{t-1}|x_t)
die
dit
proces
reverseert.
Tijdens
training
wordt
de
parameter
theta
aangepast
zodat
de
omgekeerde
stappen
de
oorspronkelijke
data
kunnen
reconstrueren.
Modellen
zijn
vaak
gebaseerd
op
een
denoising-netwerk
en
kunnen
varianten
van
variational
inference
of
score
matching
volgen.
models
(LDMs)
voeren
de
diffusie
uit
in
een
lagere
latentruimte,
wat
de
rekentijd
vergemakkelijkt.
Veel
systemen
gebruiken
een
U-Net-architectuur
en
conditioneringsmechanismen
zoals
tekstprompts.
en
grote
diversiteit,
maar
vergen
veel
rekentijd
bij
sampling
en
grote
datasets
voor
training.
Daarnaast
spelen
bias,
copyright
en
veiligheidsrisico’s
een
rol
bij
het
gebruik
en
deployment.
die
een
ruisgedreven
generatief
proces
voorstellen.
In
2020–2022
kwamen
DDPM,
DDIM
en
latent
diffusion
modellen
populair,
met
toepassingen
zoals
Stable
Diffusion
op
de
voorgrond.