Home

referensgenom

Referensgenom, eller reference genome, är en sammanställd DNA-sekvens som används som standard för att jämföra och annotera genom hos en art eller population. Det ger ett enhetligt koordinatsystem för att beskriva var gener, regulatoriska element och genetiska variationer finns längs kromosomerna. Ett referensgenom är inte ett enskilt individs genom utan en sammansättning av flera källor och uppdateras över tid med nya versioner.

I människan har referensgenomet utvecklats av Genome Reference Consortium (GRC). Viktiga versioner är GRCh37/hg19 och GRCh38/hg38,

Begränsningar och utmaningar: Referensgenomet speglar inte hela mänskliga mångfald. Det är bias mot de individer som

Framtid och alternativ: För att fånga populationens variation används begreppet pangenom eller grafbaserade referenser, där flera

ofta
följda
av
patchar
och
justeringar.
Referensgenomet
används
som
bas
i
sekvensanalys,
där
korta
läsningar
från
en
individ
mappas
mot
referenssekvensen
och
variationer
konstrueras
som
varianter.
Koordinaterna
används
av
databaser
som
NCBI,
Ensembl
och
UCSC
för
att
ange
platsen
för
gener,
exoner
och
funktionella
element.
bidrog
mest
till
uppbyggnaden
och
vissa
regioner
är
repetitiva
eller
saknas
helt,
vilket
kan
påverka
mappning
och
tolkning
av
variationer.
Uppdateringar
kräver
ofta
omanalys
av
data
och
liftover
mellan
versioner.
Dessa
problem
arbetar
forskningen
aktivt
med
att
åtgärda.
haplotyper
representeras
inom
ett
gemensamt
grafbaserat
ramverk.
Initiativ
som
Human
Pangenome
Reference
Consortium
utforskar
grafbaserade
referenser
som
minskar
referensbias
och
förbättrar
noggrannhet
vid
mappning
och
varianttolkning.