referansebaser
Referansebaser er de enkeltbasene som utgjør et referansegenom og fungerer som en felles standard mot hvilken sekvenser fra prøver blir sammenlignet. For hvert koordinat i referansegenomet finnes en basis — vanligvis en av adenin (A), cytosin (C), guanin (G) eller thymin (T) — som definerer referanseallelen ved den posisjonen. Når sekvensdata fra en prøve analyseres, blir innholdet i prøven sammenlignet med referansebasene for å oppdage variasjoner.
Referansebasenes primære bruk er å tilby et koordinatsystem for hele genomet og å støtte identifikasjon av
Data representerer referansebasene i form av et FASTA- eller lignende sekvensformat, mens avvik fra referansen ofte
Utfordringer inkluderer referansebias slik at enkelte varianter virker mindre sannsynlige enn de er, samt områder med