Home

sequentieanalyse

Sequentieanalyse is een verzamelnaam voor methoden die sequenties van letters of symbolen bestuderen. In de biologie en biotechnologie richt het zich vooral op DNA-, RNA- en eiwitsequenties en omvat het identificeren van genen, het voorspellen van functies, het opsporen van variaties en het onderzoeken van evolutionaire relaties. Ook buiten de biologie kan sequentieanalyse betrekking hebben op de analyse van numerieke of symbolische reeksen in wiskunde en informatica.

In bio-informatica begint sequentieanalyse meestal met data-generatie via sequencing, gevolgd door kwaliteitscontrole en pre-processing. Vervolgens worden

Veelgebruikte technieken en tools omvatten sequentie-alignment (BLAST, BWA, Bowtie) en multiple sequence alignment (MAFFT, Clustal Omega),

Toepassingen van sequentieanalyse zijn onder meer medische genomica, evolutiebiologie, landbouw en forensische analyse. Belangrijke uitdagingen zijn

sequenties
vergeleken
met
referenties
of
de
novo
gevormd,
waarna
annotatie
van
genen
en
functies
plaatsvindt.
Bij
analyse
van
variatie
worden
single
nucleotide
polymorphisms
(SNP's)
en
indels
geïdentificeerd,
en
soms
ook
structurele
variaties.
Verder
wordt
vaak
fylogenetische
analyse
uitgevoerd
om
verwantschappen
tussen
soorten
te
bepalen.
transcriptieanalyse
(RNA-seq)
en
de
novo
of
reference-guided
assemblage
(SPAdes,
Trinity).
Voor
functionele
interpretatie
zijn
databases
en
tools
zoals
GenBank
en
ENA
gangbaar,
en
motief-
en
domeinanalyses
(HMMER,
MEME)
worden
toegepast.
Fylogenie
en
tijdsafhankelijke
analyses
worden
uitgevoerd
met
programma's
zoals
RAxML
en
BEAST.
de
grote
hoeveelheden
data,
sequencing-fouten,
integratie
van
verschillende
databronnen
en
kwesties
rond
privacy
en
reproductibiliteit.
Het
doel
is
betrouwbare
interpretatie
van
sequentie-informatie
die
leidt
tot
nieuw
begrip
van
functioneren,
ziekte
en
evolutie.