Home

referensgenomet

Referensgenomet är en sammanställd, representativ sekvens av en art som används som mall vid genomsekvensering och analys. Det ger ett enhetligt koordinatsystem för placering av läsdata, annotering av gener och regulatoriska element samt underlättar jämförelser mellan studier och analysverktyg. Det är inte ett enskilt individens genom utan en konstruktion som speglar artens variation.

Användningar inkluderar kartläggning av nya sekvenser mot referensgenomet för att fastställa var variationer uppträder (variantkallelse), annotering

Strukturen består av kromosomerna 1–22 samt X och Y, samt regioner som inte är fullt placerade i

Begränsningar inkluderar att referensgenomet speglar en viss haplotyp och kan biasera analyser mot referensalleler, särskilt i

av
funktionella
element
och
jämförelse
av
data
mellan
studier
och
analysverktyg.
Det
tillhandahåller
även
ett
gemensamt
koordinatsystem
för
liftover
mellan
olika
referensversioner
och
för
jämförelser
över
projekt
och
arter.
kromosomerna.
Den
inkluderar
alternativa
haplotyper
(ALT-loci)
och
vissa
decoy-sekvenser
som
används
vid
mappning.
För
mänskliga
data
är
GRCh38
den
aktuella
referensen,
efter
GRCh37;
förvaltningen
görs
av
Genome
Reference
Consortium
i
samarbete
med
NCBI,
UCSC
och
EBI.
Uppdateringar
ges
som
patchar,
till
exempel
GRCh38.p13.
Andra
arter
har
liknande
referensgenom,
som
musen
GRCm39.
populationer
som
avviker
från
referensekvensen.
Det
undervärderar
ofta
större
strukturella
variationer
och
repetitiva
regioner,
och
som
en
linjär
referens
begränsar
det
vissa
tillämpningar.
Framtiden
rymmer
pangenom-
eller
grafbaserade
referensramverk
som
inkluderar
flera
haplotyper
och
populationer
för
att
bättre
fånga
artens
genetiska
mångfald.