gelijkenispercentage
Gelijkenispercentage is een numerieke maat die aangeeft hoeveel twee objecten op elkaar lijken, uitgedrukt als een percentage tussen 0% en 100%. Een hogere waarde wijst op een grotere gelijkenis; 100% betekent identiek volgens de gebruikte maatstaf. De term wordt toegepast in verschillende vakgebieden, zoals tekstvergelijking, databankdeduplicatie en beeld- of audioanalyse, en er bestaat geen eenduidige, universele formule.
Afhankelijk van het type data bestaan verschillende gangbare methoden. Voor tekst kan men de Levenshteinafstand gebruiken;
Drempelwaarden voor wat als een “hoge” gelijkenis geldt, variëren per domein en per gebruikte methode. In plagiaatdetectie,
---