FASTQDateien
FASTQDateien, oft FASTQ genannt, sind ein Textformat zur Speicherung von Sequenzdaten aus der modernen Hochdurchsatz-Sequenzierung. Sie kombinieren die rohen Nukleotidsequenzen mit zugehörigen Qualitätswerten für jede Basenposition. Das Format wird in vielen Bioinformatik-Workflows verwendet, einschließlich Qualitätskontrolle, Trimmung, Alignierung und Variantenanalyse.
Aufbau: Jeder Leseeintrag besteht aus vier Zeilen: 1) eine Überschrift, die mit einem @ beginnt und Informationen
Dateien können unkomprimiert vorliegen oder komprimiert als .fastq.gz gespeichert werden. Aufgrund ihrer Größe werden FASTQ-Dateien oft
Historisch entstanden FASTQ-Dateien aus dem Bedarf, Sequenzierungsresultate direkt mit Qualitätsinformationen zu verknüpfen. Sie sind in Genom-