Home

referentiegenoomannotaties

Referentiegenoomannotaties zijn verzamelde gegevens die de posities en kenmerken van functionele elementen op een referentie-genomen annoteren. Ze leveren een consistente kaart van genen, transcripts, exons, introns, UTRs, regulatorische regio’s en andere genomische elementen die relevant zijn voor analyses en interpretatie.

De annotaties omvatten verschillende typen features, zoals genen en isoformes, coderende en niet-coderende RNA’s, pijlers van

Gegevens worden opgeslagen in formele bestandsformaten zoals GTF/GFF(GFF3), BED en aanverwante tab-gestructureerde bestanden. Varianten en verbindingen

Belangrijke bronnen voor referentiegenoomannotaties zijn onder meer Ensembl, GENCODE, RefSeq en de UCSC Genome Browser. Deze

Uitdagingen omvatten onvolledige of ambiguïteit in isoforms, verschillen tussen annotaties en verouderde referenties. Goede praktijken zijn

regulatie
(promoters,
enhancers,
silencers)
en
repeat-
en
pseudogene
regio’s.
Ze
worden
vaak
gecombineerd
met
functionaliteitskenmerken
zoals
genenergie,
transcriptie-uur
en
savante
relaties
aan
andere
databases
(GO,
pathways).
Achter
elk
element
staan
coordinates
en
bi-directionele
relaties
(zoals
which
transcript
belongs
to
welk
gen).
met
de
annotaties
worden
beheerd
en
bijgewerkt
bij
nieuwe
referentie-assemblages.
Veranderingen
tussen
assemblies
vragen
vaak
om
liftOver
of
herannotatie.
Het
is
gebruikelijk
om
versies
en
bronnen
expliciet
te
vermelden,
aangezien
annotaties
continu
worden
geüpdatet.
bronnen
leveren
de
basis
voor
downstream
analyses
zoals
RNA-seq-quantificatie,
variant-interpretatie
en
functie-annotatie.
Ze
worden
gebruikt
in
combinatie
met
analysepipelines
(bijv.
variantannotatie
met
VEP
of
SnpEff,
transcript-quantificatie
met
featureCounts/HTSeq)
en
in
visuele
exploratie
via
genome
browsersondersteuning.
onder
meer
het
vermelden
van
de
gebruikte
versie,
het
verifiëren
van
annotaties
tegen
meerdere
bronnen
en
het
plannen
van
regelmatige
bijwerkingen
bij
nieuwe
assemblies.