Expressionsdaten
Expressionsdaten sind Messwerte, die die Expressionslevel von Transkripten in biologischen Proben widerspiegeln. In der Regel wird eine Expressionsdatenmatrix verwendet, in der Zeilen Gene oder Transkripte und Spalten Proben darstellen. Die Werte können roh vorliegen (Counts bei RNA-Seq oder Intensitäten bei Microarrays) oder normalisiert und transformiert sein (z. B. RPKM/FPKM, TPM, log2).
Hauptquellen sind Microarrays, RNA-Seq und qPCR. Microarrays messen Hybridisierungssignale; RNA-Seq liefert sequenzbasierte Zählwerte; qPCR ergibt relative
Metadaten in Expressionsdaten umfassen Probencharakteristika, Versuchsdesign und experimentelle Bedingungen. Wichtige Vorverarbeitungsschritte sind Qualitätskontrolle, Fehlerkorrektur, Skalierung und
Anwendungen umfassen differentielle Expressionsanalyse, Cluster- oder Mustererkennung, Netzwerkanalysen und Biomarker-Suche; Funktions- und Pfadanalysen mittels GO oder
Formate sind typischerweise Tabellen (CSV/TSV) mit Gene-IDs und Expressionswerten sowie begleitenden Metadaten. Die korrekte Handhabung von