sequentiegelijkenis
Sequentiegelijkenis is een maatstaf voor de mate waarin twee sequenties overeenkomen, waarbij zowel de inhoud als de volgorde van de elementen in de sequentie in beschouwing worden genomen. De term wordt in verschillende vakgebieden toegepast en kan verwijzen naar zowel discrete symbolen (bijvoorbeeld tekens of nucleotiden) als meer abstracte symbolen in tijdreeksen of gedragingen.
Meestal wordt sequentiegelijkenis bepaald met behulp van afstands- of gelijkenismaatregelen. Veel gebruikte benaderingen zijn bewerkingsafstanden, zoals
Toepassingsgebieden zijn onder meer bioinformatica (vergelijking van DNA-, RNA- en eiwitsequenties), natuurlijk taalverwerking (vergelijking van zinnen
Overwegingen en beperkingen omvatten computationele complexiteit, gevoeligheid voor ruis, en de behandeling van gaps. Het kiezen
Zie ook: sequentie-alignment, edit distance, tijdreeksanalyse, n-grammen, gelijkenismetrieken.