Home

DNASequenzvergleich

DNASequenzvergleich bezeichnet den Prozess des Vergleichs von DNA-Sequenzen, um Ähnlichkeiten und Unterschiede zu erkennen. Ziel ist es, evolutionäre Beziehungen, funktionale Regionen oder die Identität eines Genoms zu bestimmen. Er umfasst alignementbasierte Verfahren sowie alignmentfreie Ansätze.

Alignments werden häufig verwendet, um Ähnlichkeiten zwischen Sequenzen zu messen. Globaler Alignment vergleicht ganze Sequenzen, während

Alignmentfreie Verfahren nutzen k-mer-Statistiken, MinHash oder Sketching, um Sequenzen schnell zu vergleichen. Sie eignen sich gut

Anwendungen des DNASequenzvergleichs umfassen Phylogenie und Evolutionsforschung, Genom- und Transkriptomannotation, Erkennung von Mutationen und Polymorphismen, Forensik,

Datenformate und Arbeitsabläufe: Sequenzen liegen oft in FASTA- oder FASTQ-Dateien vor; Alignments in SAM/BAM, Variantenlisten in

Herausforderungen sind unter anderem repetitives DNA, strukturelle Varianten, Sequenzierungsfehler, unterschiedliche Evolutionsraten sowie der erhebliche Rechenaufwand bei

Wichtige Werkzeuge und Ressourcen umfassen Programme wie BLAST, MAFFT und MUSCLE für Alignments sowie BWA oder

lokaler
Alignment
sich
auf
bestmögliche
Teilabschnitte
konzentriert.
Ergebnisse
liefern
eine
Ausrichtung,
Identität,
Ähnlichkeit
sowie
Informationen
zu
Lücken.
Score-Systeme
mit
Substitutionsmatrizen
und
Gap-Penalties
bestimmen
die
Bewertung.
für
große
Genome,
Metagenomik
und
grobe
Einschätzungen,
wenn
exakte
Ausrichtungen
zu
aufwendig
sind.
Artbestimmung
und
Metagenomik.
VCF.
Typische
Kennzahlen
sind
Identität,
Ähnlichkeit
und
Abstände,
die
für
Klusterung,
Annotation
oder
weitergehende
Analysen
genutzt
werden.
großen
Datensätzen.
Bowtie
für
Read-Mapping.
Öffentliche
Datenbanken
wie
NCBI
und
ENA
liefern
Referenzsequenzen.