Levenshteinetäisyys
Levenshteinetäisyys määritellään kahden merkkijonon välisenä pienimmän määrän yksittäisiä muokkauksia, joita tarvitaan toisen merkkijonon muuttamiseksi toiseen. Sallitut muokkaukset ovat merkin lisäys, poistaminen ja korvaaminen; kustannukset ovat tavallisesti yhtä suuret. Nimi juontaa Vladimir Levenshineen, joka julkaisi menetelmän vuonna 1965.
Käytännön laskenta tapahtuu dynaamisella ohjelmoinnilla. Tehtävä muodostetaan (n+1) × (m+1) -matriisiksi, jossa n ja m ovat
Variantteja ovat Damerau–Levenshtein-etäisyys, joka sallii kahden peräkkäisen merkin vaihdon yhdessä muokkauksessa, sekä painotettu Levenshtein, jossa eri
Sovellukset kattavat oikeinkirjoituksen tarkistuksen, fuzzy-hakujen ja ehdotusten generoinnin, OCR-virheiden korjaamisen sekä geneettisten sekvenssien tai muiden tekstipohjaisten