Basenaufrufen
Basenaufrufen, englisch base calling, ist der rechnerische Prozess, bei dem Rohsignale von Sequenziergeräten in eine Zeichenkette aus Nukleotiden übersetzt wird, üblicherweise A, C, G und T (mit N für unbekannt). Es ist eine zentrale Aufgabe in der Datenverarbeitung von DNA- und RNA-Sequenzierung, sowohl bei klassischen Sanger- als auch bei Hochdurchsatzplattformen.
In der Sanger-Sequenzierung werden die Peaks im Elektropherogramm bewertet und in Basen übersetzt. Bei Hochdurchsatzplattformen wie
Methodisch reicht das Spektrum von einfachen Schwellenwert-Ansätzen bis zu komplexen probabilistischen Modellen wie Hidden Markov Models
Typische Herausforderungen umfassen Signalrauschen, Phasing- und Pre-Phasing-Effekte, Abnutzung des Signals, Homopolymere bei bestimmten Plattformen und platformabhängige
Ausgabe ist meist eine FASTQ-Datei, die Sequenzdaten zusammen mit Qualitätsscores enthält. Basenaufrufen sind somit eine fundamentale