DNAsekvensdata
DNAsekvensdata är den digitala representationen av nukleotidsekvenser från DNA-prover. Den består av baserna A, C, G och T i en viss ordning, ofta tillsammans med kvalitetspoäng som anger läsarnas tillförlitlighet.
Vanliga sequencing-teknologier inkluderar Illumina (kortläsande) samt PacBio och Oxford Nanopore (långläsande). Dessa metoder ger olika läslängder,
DNAsekvensdata lagras i nationella och internationella arkiv som GenBank, ENA, DDBJ och NCBI SRA. Metadata kopplas
Användningsområden inkluderar kartläggning mot referensgenom, de novo-assembly, variantkallelse och funktionell annotering. Inom klinik används DNAsekvensdata för
Etik och integritet är centrala när humana data hanteras; samtycke, anonymisering och efterlevnad av dataskyddslagar som
Utmaningar omfattar enorma datamängder, behov av standardisering och betydande beräkningsresurser. Framtiden väntas präglas av ökad molnbaserad