Home

Referenzsequenzen

Referenzsequenzen sind standardisierte Sequenzen von Nukleotiden oder Aminosäuren, die als Bezugspunkt für Vergleiche, Annotationen und analytische Berechnungen dienen. Sie ermöglichen es, experimentelle Daten zu interpretieren, Variationen zu identifizieren und Funktionen abzuleiten.

In der Genomik und Transkriptomik werden Referenzsequenzen genutzt. Ein Referenzgenom dient als gemeinsamer Bezugrahmen für die

Quellen und Formate: Referenzsequenzen stammen aus Datenbanken wie RefSeq, GenBank oder Ensembl. Sequenzen werden oft im

Eigenschaften und Einschränkungen: Referenzsequenzen bieten Konsistenz für Vergleiche und Analysen, können aber Bias verursachen, weil sie

Anwendungen: Genomische Abgleichung (Alignment), Variationsanalyse, Genom- und Transkript-Annotation sowie die funktionelle Interpretation klinischer Sequenzdaten.

Zuordnung
von
Sequenzreads,
die
Erkennung
von
Varianten
und
die
Annotation
von
Merkmalen.
Für
einzelne
Gene
liefern
Referenztranskripte
und
Referenzproteine
kuratierte
Sequenzen,
die
zur
Identifizierung
von
Transkripten
und
Proteinfunktionen
verwendet
werden.
Populäre
Beispiele
sind
das
menschliche
Referenzgenom
GRCh38
und
zugehörige
RefSeq-Transkripte
(z.
B.
NM-IDs)
sowie
Referenzproteine
(NP-IDs).
FASTA-Format
bereitgestellt,
mit
Koordinatensystemen
wie
Chromosomen-
und
Genompositionen.
eine
bestimmte
Population
oder
Struktur
repräsentieren.
Nicht
dargestellte
Varianten
oder
größere
strukturelle
Unterschiede
können
schwer
abzubilden
sein.
Aufgrund
von
Update-Zyklen
müssen
Referenzsequenzen
regelmäßig
überprüft
und
gegebenenfalls
ersetzt
oder
ergänzt
werden.