Distanzmaßes
Distanzmaßes, auch Distanz- oder Abstandsmaße genannt, sind Funktionen, die zwei Objekte aus einer definierten Menge X durch eine nicht negative Zahl d(x,y) zuordnen. Sie quantifizieren Unähnlichkeiten oder Ähnlichkeiten und finden Anwendung in Statistik, maschinellem Lernen und Informatik. Oft unterscheidet man metrische Abstände von distanzbasierten Maßen, die Axiomen einer Metrik nicht vollständig erfüllen.
Eine Metrik erfüllt typischerweise vier Axiome: Nicht-Negativität, Identität der Indistinguishierbaren (d(x,y)=0 genau dann, wenn x=y), Symmetrie
Zu den verbreitetsten Distanzmaßen zählen: Euclidean distance d_E(x,y) = sqrt(sum_i (x_i - y_i)^2); Manhattan distance d_M(x,y) = sum_i |x_i
Die Wahl hängt vom Datentyp ab (numerisch, binär, kategorial), von der Empfindlichkeit gegenüber Ausreißern und vom