Basenlesen
Basenlesen bezeichnet in der Bioinformatik den Prozess, Rohsignale aus Sequenziergeräten in eine Abfolge von Nukleotiden zu übersetzen. Dabei wird aus den Messdaten die Sequenz der Basen Adenin, Cytosin, Guanin und Thymin (T) bzw. Uracil (U) in RNA bestimmt und gleichzeitig eine Qualitätsbewertung pro Base zugewiesen. In der Praxis dient das Basenlesen als zentrale Vorstufe der Datenanalyse in der Genomik und Transkriptomik.
Historisch entwickelte sich das Basenlesen mit der Sanger-Sequenzierung zu automatisierten, maßgeblich durch Sequenzierplattformen beeinflussten Verfahren. In
Technologien unterscheiden sich wesentlich. Bei Illumina-Sequenzierung erfolgen Basecalls primär aus Fluoreszenzsignalen mit kurzen Reads und hoher
Anwendungen des Basenlesens reichen von der Genom- und Exom-Analyse bis hin zur Transkriptom- und Metagenomik. Typische
See also: basecalling, sequencing, quality score, variant calling.