Sequenzierungsdaten
Sequenzierungsdaten sind Datensätze, die durch Sequenzierung von DNA oder RNA gewonnen werden. Sie bilden die Abfolge der Nukleotide in den untersuchten Proben ab und können Rohdaten, Qualitätsinformationen und Metadaten enthalten. Moderne Hochdurchsatz-Sequenzierung (Next-Generation Sequencing, NGS) erzeugt enorme Mengen an kurzen oder langen Reads und wird in Genomik, Transkriptomik, Metagenomik und klinischen Studien eingesetzt.
Rohdaten liegen typischerweise im FASTQ-Format vor, das Sequenzabfolgen mit per-Base-Qualitätswerten verbindet. Nach der Auswertung ergeben sich
Die Erzeugung umfasst Probenvorbereitung, Bibliotheken, Sequenzierung und Qualitätskontrolle (beispielsweise mit FastQC). Typische Analyse-Pipelines umfassen Trimming, Mapping
Anwendungen reichen von Grundlagengenomik, Transkriptomik und Metagenomik bis zur klinischen Genomik. Große Datensätze erfordern erhebliche Speicher-