Diffusionsdistanz
Diffusionsdistanz, im Englischen oft als diffusion distance bezeichnet, ist eine Metrik auf einem Datensatz, die aus einem Diffusionsprozess auf dem Datensatz abgeleitet wird. Sie spielt eine zentrale Rolle in der Diffusionsabbildung (diffusion maps) und dient dazu, die zugrunde liegende Geometrie der Daten zu erfassen. Die Idee ist, Datenpunkte über Wahrscheinlichkeiten eines zufälligen Spaziergangs auf einem graphbasierten Modell zu verbinden und aus der Diffusion zwischen Punkten eine Distanz abzuleiten.
Konstruktion und Interpretation: Man beginnt mit einer Ähnlichkeitsmatrix, typischerweise durch Kernel-Funktionen wie k(x,y) = exp(-||x-y||^2/ε) und normalisiert
Eigenschaften und Anwendungen: D_t ist eine echten Metrik und spiegelt in variierten Skalen die Geometrie des
Zusammenfassend dient die Diffusionsdistanz dazu, die intrinsische Datenstruktur durch längere Diffusionsprozesse zu erfassen und ist eng