LevenshteinDistanz
Die LevenshteinDistanz, auch Levenshtein-Distanz genannt, ist ein Maß für die minimale Anzahl von Einzelbearbeitungen, mit denen zwei Zeichenketten in eine gegenseitige Übereinstimmung überführt werden können. Die Bearbeitungen umfassen Einfügen, Löschen und Ersetzen einzelner Zeichen. Die Distanz ist nach dem russischen Wissenschaftler Vladimir Levenshtein benannt, der das Konzept 1965 vorstellte.
Formal lässt sich die Distanz für zwei Zeichenketten s mit Länge m und t mit Länge n
Eigenschaften und Variationen: Die LevenshteinDistanz erfüllt grundlegende Metrik-Eigenschaften (Nicht-Negativität, Identität, Symmetrie, Dreiecksungleichung). Die maximale Distanz zwischen
Anwendungsgebiete umfassen Rechtschreibprüfung, fuzzy Matching, Auto-Korrektur, DNA-Sequenzvergleich und allgemeine Mustererkennung in Textdaten.