genomitietokannoista
Genomitietokannat ovat tieteellisiä tietokantoja, jotka tallentavat genomitasoista dataa ja tekevät sen helposti käytettäväksi tutkimuksessa. Niihin sisältyvät DNA- ja RNA-sekvenssit, geeneihin liittyvät annotaatiot, säätelevien elementtien tiedot sekä rakenteelliset ja periytyvät variantit. Tietokannat mahdollistavat vertailevan genomianalyysin, varianttien tulkinnan sekä kehittävät välineitä ja sovelluksia, kuten kliinisen genomiikan työkaluja ja tutkimusdatan hallintaa.
Kansainvälisesti merkittäviä kokonaisuuksia ovat INSDC, jossa GenBank (NCBI, Yhdysvallat), ENA (EMBL-EBI, Eurooppa) ja DDBJ (Japani) muodostavat
Data muodostuu useista formaateista, kuten FASTA/FASTQ-sekvenssimateriaalista, GFF/GTF-annotaatioista sekä VCF-varianttitiedostoista, sekä niihin liittyvistä meta-tiedoista, kuten laji, kantamuoto
Haasteina ovat tiedon standardointi ja yhteentoimivuus, datan laatu ja päivitys, tallennuskapasiteetti sekä tietosuoja. Genomitietokannat tukevat laajaa