Home

DNARNASequenzen

DNARNASequenzen bezeichnet die linear angeordneten Nukleotidfolgen in DNA und RNA, die genetische Informationen tragen. DNA-Sequenzen bestehen aus den Basen Adenin (A), Thymin (T), Cytosin (C) und Guanin (G) und liegen üblicherweise als Doppelhelix vor. RNA-Sequenzen verwenden Adenin, Cytosin, Guanin und Uracil (U) und sind meist einsträngig. Sequenzen werden üblicherweise in der 5'-zu-3'-Richtung gelesen, wobei der Gegenstrang der DNA komplementär ist.

Notation und Orientierung: Sequenzen werden oft in Textform geschrieben, wobei die Orientierung 5'→3' wichtig ist. Die

Sequenzierung und Datenformate: Die Bestimmung der Nukleotidreihen kann mit Sanger-Sequencing, Next-Generation Sequencing (NGS) oder Third-Generation-Technologien erfolgen.

Anwendungen und Herausforderungen: DNARNASequenzen bilden die Grundlage für Genom- und Transkriptom-Analysen, Genannotationen, Evolutionsstudien sowie medizinische Diagnostik

Begriffe
Sense-
und
Antisense-Strang
beschreiben,
welcher
Strang
als
Vorlage
dient.
In
biologischen
Analysen
spielen
zudem
Chomskysche
und
annotative
Referenzen
eine
Rolle,
etwa
bei
der
Bestimmung
von
Start-
und
Stoppkodons
oder
regulatorischen
Elementen.
Sequenzdaten
werden
häufig
in
Formaten
wie
FASTA
oder
FASTQ
gespeichert,
wobei
FASTQ
zusätzlich
Qualitätswerte
der
einzelnen
Basen
enthält.
Rechenwerkzeuge
wandeln
rohe
Rohdaten
in
interpretierbare
Sequenzen
um
und
ermöglichen
Alignment,
Assemblierung
und
Annotation.
und
forensische
Anwendungen.
Herausforderungen
sind
Sequenzierungsfehler,
wiederholte
Regionen,
Strukturvarianzen
und
die
Tatsache,
dass
reine
Basenfolgen
epigenetische
Modifikationen
oder
Expressionslevel
nicht
abbilden;
hierzu
werden
ergänzende
Datentypen
benötigt.
Datenbanken
wie
GenBank,
EMBL
und
DDBJ
archivieren
öffentliche
Sequenzen
und
fördern
den
Austausch.