Acides aminés protéinogènes
Un acide aminé protéinogène est un acide aminé incorporé dans les protéines lors de la traduction de l'ARN messager par les ribosomes1. Il existe en tout 22 acides aminés protéinogènes, ce qualificatif étant forgé à partir de racines grecques signifiant précisément « qui donne naissance aux protéines ». Parmi ceux-ci, 20 acides aminés, dits acides aminés standards, sont codés directement par un codon de l'ADN nucléaire. Deux autres acides aminés protéinogènes sont codés indirectement par des codons-stop qui sont recodés en codons d'acides aminés en présence de séquences d'insertion particulières, appelées élément SECIS pour la sélénocystéine et élément PYLIS pour la pyrrolysine. La pyrrolysine n'est présente que dans les protéines de certaines archées méthanogènes, de sorte que les eucaryotes et les bactéries n'utilisent que 21 acides aminés protéinogènes.
Bien qu'elle présente une chaîne latérale identique à celle de la méthionine, la N-formylméthionine est parfois considérée comme un 23e acide aminé protéinogène car, chez les procaryotes ainsi que dans les mitochondries et les chloroplastes des eucaryotes, c'est elle qui est incorporée par les ribosomes à la place de la méthionine au début des chaînes polypeptidiques lors de la traduction de l'ARN messager ; ce résidu est souvent éliminé par la suite par modification post-traductionnelle de la protéine néoformée2. Diagramme organisant les 20 acides aminés protéinogènes standard de la biochimie, hormis la pyrrolysine et la sélénocystéine.
Le corps humain est capable de synthétiser 12 des 21 acides aminés protéinogènes qu'il utilise, tandis que neuf d'entre eux, dits acides aminés essentiels, doivent lui être apportés par l'alimentation : histidine, isoleucine, leucine, lysine, méthionine, phénylalanine, thréonine, tryptophane et valine.
En revanche, les acides aminés non protéinogènes peuvent être incorporés dans les protéines au cours de modifications post-traductionnelles, comme le γ-carboxyglutamate ou l'hydroxyproline, voire être totalement absents des protéines, comme l'acide γ-aminobutyrique ou la DOPA.
Structure des acides aminés protéinogènes
La planche ci-dessous présente la structure non ionisée des 22 acides aminés protéinogènes ; en solution aqueuse à pH physiologique, les fonctions carboxyle –COOH et amine Modèle:Fchim sont ionisées en carboxylate –COO– et ammonium Modèle:Fchim, les espèces chimiques correspondantes sont des zwitterions.
Propriétés chimiques
Le tableau ci-dessous résume les principales propriétés chimiques des acides aminés protéinogènes et de leur chaîne latérale. Les valeurs proposées pour le point isoélectrique et les constantes d'acidité sont celles de l'université de Calgary en Alberta.
Acide aminé | Abrév. | Masse (Da) | pI | Rayon de van der Waals |
pKa1 (α-COOH) |
pKa2 (α-+NH3) |
Chaîne latérale | |||
---|---|---|---|---|---|---|---|---|---|---|
pKR | Structure | Nature | ||||||||
Alanine | A | Ala | 89,09404 | 6,00 | 67 | 2,34 | 9,60 | Modèle:Fchim | Hydrophobe | |
Arginine | R | Arg | 174,20274 | 10,76 | 148 | 2,17 | 9,04 | 12,48 | Modèle:Fchim–[[Guanidine|Modèle:Fchim]] | Polaire, très basique |
Asparagine | N | Asn | 132,11904 | 5,41 | 96 | 2,02 | 8,80 | Modèle:Fchim | Polaire | |
Aspartate | D | Asp | 133,10384 | 2,77 | 91 | 1,88 | 9,60 | 3,65 | Modèle:Fchim | Polaire, acide |
Cystéine | C | Cys | 121,15404 | 5,07 | 86 | 1,96 | 10,70 | 8,33 | Modèle:Fchim | Hydrophobe<ref name="10.1111/j.1432-1033.1968.tb19535.x">La cystéine est une molécule polaire, cependant les résidus de cystéine des protéines sont souvent impliqués dans des interactions hydrophobes et assurent de ce fait une fonction biochimique essentiellement apolaire : , faiblement acide |
Glutamate | E | Glu | 147,13074 | 3,22 | 109 | 2,19 | 9,67 | 4,25 | Modèle:Fchim | Polaire, acide |
Glutamine | Q | Gln | 146,14594 | 5,65 | 114 | 2,17 | 9,13 | Modèle:Fchim | Polaire | |
Glycine | G | Gly | 75,06714 | 5,97 | 48 | 2,34 | 9,60 | –H | Hydrophobe | |
Histidine | H | His | 155,15634 | 7,59 | 118 | 1,82 | 9,17 | 6,00 | Modèle:Fchim-[[Imidazole|Modèle:Fchim]] | Polaire, faiblement basique, aromatique |
Isoleucine | I | Ile | 131,17464 | 6,02 | 124 | 2,36 | 9,60 | Modèle:Fchim | Hydrophobe, aliphatique | |
Leucine | L | Leu | 131,17464 | 5,98 | 124 | 2,36 | 9,60 | Modèle:Fchim | Hydrophobe, aliphatique | |
Lysine | K | Lys | 146,18934 | 9,74 | 135 | 2,18 | 8,95 | 10,53 | Modèle:Fchim | Polaire, basique |
Méthionine | M | Met | 149,20784 | 5,74 | 124 | 2,28 | 9,21 | Modèle:Fchim | Hydrophobe | |
Phénylalanine | F | Phe | 165,19184 | 5,48 | 135 | 1,83 | 9,13 | Modèle:Fchim–[[Phényle|Modèle:Fchim]] | Hydrophobe, aromatique | |
Proline | P | Pro | 115,13194 | 6,30 | 90 | 1,99 | 10,60 | Modèle:Fchim | Hydrophobe | |
Pyrrolysine | O | Pyl | 255,31 | Modèle:Fchim–[[Azoline|Modèle:Fchim]]–Modèle:Fchim | Polaire, faiblement basique | |||||
Sélénocystéine | U | Sel | 168,053 | 5,47 | 5,73 | Modèle:Fchim | ||||
Sérine | S | Ser | 105,09344 | 5,68 | 73 | 2,21 | 9,15 | 5,68 | Modèle:Fchim | Polaire, faiblement acide |
Thréonine | T | Thr | 119,12034 | 5,60 | 93 | 2,09 | 9,10 | 5,53 | Modèle:Fchim | Polaire, faiblement acide |
Tryptophane | W | Trp | 204,22844 | 5,89 | 163 | 2,83 | 9,39 | 5,885 | Modèle:Fchim–[[Indole|Modèle:Fchim]] | Polaire, faiblement basique, aromatique |
Tyrosine | Y | Tyr | 181,19124 | 5,66 | 141 | 2,20 | 9,11 | 10,07 | Modèle:Fchim–[[Phénol (groupe)|Modèle:Fchim]] | Polaire, faiblement acide, aromatique |
Valine | V | Val | 117,14784 | 5,96 | 105 | 2,32 | 9,62 | Modèle:Fchim | Hydrophobe, aliphatique |
La valeur du pKR ici donnée correspond à l'acide aminé libre. Cette valeur varie sensiblement pour les résidus d'acides aminés présents dans les protéines, comme l'indique le tableau ci-dessous :
Acide aminé | Abrév. | Libre | Résidu | |
---|---|---|---|---|
Aspartate | D | Asp | 3,65 | 3,7 – 4,0 |
Arginine | R | Arg | 12,48 | – |
Glutamate | E | Glu | 4,25 | 4,2 – 4,5 |
Cystéine | C | Cys | 8,33 | 8,8 – 9,1 |
Histidine | H | His | 6,00 | 6,7 – 7,1 |
Lysine | K | Lys | 10,53 | 9,3 – 9,5 |
Tyrosine | Y | Tyr | 10,07 | 9,7 – 10,1 |
Expression génétique
Le tableau ci-dessous présente les codons d'ARN messager correspondant à chacun des 22 aminés protéinogènes. Les valeurs relatives à l'abondance relative des acides aminés dans les protéines varient légèrement suivant les espèces et les bases de données utilisées. Elles sont données ici à titre indicatif.
Acide aminé | Abrév. | Codon(s) d'ARN messager | Occurrence dans les protéines |
Occurrence chez les vertébrés |
Essentiel chez l'homme | |
---|---|---|---|---|---|---|
Alanine | A | Ala | GCU, GCC, GCA, GCG | 9,0 % | 7,4 % | Non |
Arginine | R | Arg | CGU, CGC, CGA, CGG, AGA, AGG | 4,7 % | 4,2 % | Selon les cas |
Asparagine | N | Asn | AAU, AAC | 4,4 % | 4,4 % | Non |
Aspartate | D | Asp | GAU, GAC | 5,5 % | 5,9 % | Non |
Cystéine | C | Cys | UGU, UGC | 2,8 % | 3,3 % | Selon les cas |
Glutamate | E | Glu | GAA, GAG | 6,2 % | 5,8 % | Selon les cas |
Glutamine | Q | Gln | CAA, CAG | 3,9 % | 3,7 % | Non |
Glycine | G | Gly | GGU, GGC, GGA, GGG | 7,5 % | 7,4 % | Non |
Histidine | H | His | CAU, CAC | 2,1 % | 2,9 % | Oui |
Isoleucine | I | Ile | AUU, AUC, AUA | 4,6 % | 3,8 % | Oui |
Leucine | L | Leu | UUA, UUG, CUU, CUC, CUA, CUG | 7,5 % | 7,6 % | Oui |
Lysine | K | Lys | AAA, AAG | 7,0 % | 7,2 % | Oui |
Méthionine | M | Met | AUG | 1,7 % | 1,8 % | Oui |
Phénylalanine | F | Phe | UUU, UUC | 3,5 % | 4,0 % | Oui |
Proline | P | Pro | CCU, CCC, CCA, CCG | 4,6 % | 5,0 % | Non |
Pyrrolysine | O | Pyl | UAG avec élément PYLIS | — | — | — |
Sélénocystéine | U | Sel | UGA avec élément SECIS | — | — | Non |
Sérine | S | Ser | UCU, UCC, UCA, UCG, AGU, AGC | 7,1 % | 8,1 % | Non |
Thréonine | T | Thr | ACU, ACC, ACA, ACG | 6,0 % | 6,2 % | Oui |
Tryptophane | W | Trp | UGG | 1,1 % | 1,3 % | Oui |
Tyrosine | Y | Tyr | UAU, UAC | 3,5 % | 3,3 % | Selon les cas |
Valine | V | Val | GUU, GUC, GUA, GUG | 6,9 % | 6,8 % | Oui |
Codon-stop | – | Term | UAA, UAG, UGA | — | — | — |
Fonctions biochimiques
Le tableau ci-dessous propose une brève description des 22 aminés classés en fonction des codes et abréviations spécifiés par le comité de nomenclature commun IUPAC - IUBMB :