Home

Aminosäurecodes

Aminosäurecodes sind symbolische Darstellungen von Aminosäuren, die vor allem in Biochemie, Molekularbiologie und Bioinformatik verwendet werden. Es gibt zwei weit verbreitete Systeme: drei Buchstaben pro Aminosäure (z. B. Ala, Arg, Asn) und ein Buchstabe pro Aminosäure (z. B. A, R, N). Die Standard- oder kanonischen Aminosäuren umfassen zwanzig, die in Genetik und Proteinsynthese eine zentrale Rolle spielen. Zusätzlich werden gelegentlich Sonderzeichen genutzt, um Mehrdeutigkeiten oder spezialisierte Aminosäuren abzubilden.

Die zehnzehn häufigsten drei Buchstaben-Codes lauten: Alanin – Ala; Arginin – Arg; Asparagin – Asn; Asparaginsäure – Asp; Cystein – Cys;

Spezialfälle umfassen Selenocystein (Sec, oft mit dem Buchstaben U dargestellt) und Pyrrolysin (Pyl, oft O). Für

Verwendung: Aminosäurecodes ermöglichen kompakte Darstellungen von Proteinsequenzen in Datenbanken, Alignments und Analysewerkzeugen. Die Codierungen stammen aus

Glutamat
–
Glu;
Glutamin
–
Gln;
Glycin
–
Gly;
Histidin
–
His;
Isoleucin
–
Ile;
Leucin
–
Leu;
Lysin
–
Lys;
Methionin
–
Met;
Phenylalanin
–
Phe;
Prolin
–
Pro;
Serin
–
Ser;
Threonin
–
Thr;
Tryptophan
–
Trp;
Tyrosin
–
Tyr;
Valin
–
Val.
Die
passende
Einbuchstaben-Darstellung
ist:
A,
R,
N,
D,
C,
E,
Q,
G,
H,
I,
L,
K,
M,
F,
P,
S,
T,
W,
Y,
V.
In
der
Praxis
kommen
auch
Sonderformen
vor,
etwa
U
für
Selenocystein
oder
O
für
Pyrrolysyn.
Mehrdeutigkeiten
werden
B
(Asp
oder
Asn),
Z
(Glu
oder
Gln)
und
J
(Leu
oder
Ile)
verwendet;
X
kennzeichnet
unbekannte
oder
nicht
bestimmten
Aminosäurerest.
Stoppsignal-Codons
werden
in
Sequenzen
häufig
mit
einem
Sternchen
(*)
gekennzeichnet.
der
frühen
Proteinchemie
und
Bioinformatik
und
sind
weltweit
standardisiert,
um
klare
Kommunikation
und
automatische
Verarbeitung
zu
ermöglichen.