sekvenssitietojen
Sekvenssitietojen avulla tallennetaan biologisten molekyylien järjestys ja siihen liittyvä metadata. Yleisesti kyse on nukleotidien (DNA- ja RNA-sekvenssit) sekä aminohappojärjestysten (proteiinien sekvenssit) kuvauksesta. Sekvenssitietoja syntyy esimerkiksi genomitason tutkimuksissa, transcriptomianalyysissä, proteiinikimmellyksissä sekä metagenomi- ja evoluutiotutkimuksissa.
Tietojen muodot ja tallennusvälineet voivat vaihdella. Yleisimpiä tekstiä sisältäviä formaatteja ovat FASTA, joka kuvaa sekvenssin juuri
Sekvenssitietoja tallennetaan ja jaetaan useilla kansainvälisillä arkistoilla. Esimerkiksi GenBank, EMBL-EBI:n ENA ja DDBJ muodostavat yhdessä maailmanlaajuisen
Sekvenssitietojen käsittely kohdistuu sekä perus- että sovellustutkimukseen, kuten genomiikan, filogeneetin, geneettisen varianttien analyysin ja monimutkaisempien ekosysteemitutkimusten