Sequenzfehler
Sequenzfehler bezeichnet Fehler, die bei der Erstellung von Sequenzdaten auftreten und zu falschen Basenaufrufen führen. Sie unterscheiden sich von echten genetischen Varianten, die im Probenmaterial vorhanden sein können, und müssen bei der Auswertung berücksichtigt werden.
Zu den Typen zählen Substitutionen, Insertions- und Deletionsfehler sowie systematische Fehler in bestimmten Kontexten wie Homopolymeren.
Verschiedene Plattformen zeigen unterschiedliche Fehlermuster. Illumina-Sequenzierung hat typischerweise niedrige Fehlerraten, vorwiegend Substitutionen. PacBio und Oxford Nanopore
Die Auswirkungen reichen von falsch positiven Varianten, fehlerhaften Genom- oder Transkript-Assemblies bis zu verzerrten phylogenetischen Analysen.
Gegenmaßnahmen umfassen Qualitätskontrollen (Trimmung, Entfernen niedriger Phred-Werte, ausreichende Abdeckung), Fehlerkorrektur- und Konsensuswerkzeuge sowie Integrationen mehrerer Datenquellen.