Le gène moléculaire, unité fonctionnelle cellulaire synthétique


Le gène héréditaire est une portion de chromosome associée à un caractère héréditaire). Il sera étudié en classe de terminale (cours de spécialité). 


Le nouveau cours de seconde (voir plan du cours) ne reprend pas la notion de gène vue en classe de troisième (programme de troisième) qui n'est qu'une confusion entre gène moléculaire et gène héréditaire. Je me contente donc, en seconde, pour me conformer au programme de traiter l'ADN comme molécule constitutive des chromosomes (voir les chromosomes et TD sur l'ADN (et les ARN)) et en 1ère de traiter la relation ADN-ARN-protéine sans entrer dans les questions d'hérédité.
* voir quelques commentaires sur la page d'accueil de ce site (07/2007) à propos de l'article de la journaliste Helen Pearson :

 What is a gene ? Helen Pearson (Nature, vol 441, 25 May 2006, 399-401).

Qu'est-ce qu'un gène ? une traduction personnelle de cet article est disponible ICI.


Le gène moléculaire est une notion plus floue* : c'est un segment d'ADN, utilisé par la cellule pour la synthèse d'un produit (ARN ou protide). C'est donc une unité fonctionnelle de synthèse des ARN et des peptides (habituellement note en bas de page): d'où le titre: unité fonctionnelle synthétique.

retour accueil, nouveau cours 1èreS, plan du cours 1èreS

 

Plan


1 -Les acides nucléiques (ADN et ARN) sont de longs polymères de nucléotides
2 - Les protéines sont de longs polymères d'acides aminés
3. L'information génétique stable est contenue dans l'ADN et copiée dans l'ARN lors de la transcription
4 . L'information génétique transitoire des ARNm est traduite en polypeptides (à l'aide d'autres ARN) dans les ribosomes du cytoplasme
5. Les peptides exportés subissent une maturation dans le REL puis dans l'appareil de Golgi avant d'atteindre la membrane ou d'être sécrétés par exocytose
6. Les gènes ne représentent qu'une petite partie de l'ADN des eucaryotes

autres pages connexes: l'alcaptonurie,
la
phénylcétonurie
ces pages demandent des connaissances de terminale


Annexes :
-
pour en finir avec les confusions nées de l'emploi des termes génotype, phénotype, allèle et gène dans le sens héréditaire, chez les procaryotes et les eucaryotes
-
pages sur les génomes (en travaux)

Remarque de vocabulaire:


les chaînes d'aa sont des peptides (aa réunis par des liaisons peptidiques). Les oligopeptides sont formés quelques aa (10...); les polypeptides sont formés de nombreux aa (10-100) mais lorsque leur poids moléculaire est supérieur à 10.000 on préfère parler de protéines.

1 -Les acides nucléiques (ADN et ARN) sont de longs polymères de nucléotides


Les acides nucléiques sont des polymères (du grec poly = plusieurs et merein = partage) (voir cours de seconde) car il sont composés d'unités identiques (les monomères). Comme il peut y avoir plusieurs types de nucléotides on parle de copolymères.


1.1 - Les acides nucléiques sont des chaînes de nucléotides.

Les nucléotides sont des molécules composées d'une base azotée (A= adénine, T=thymine, U=uracile, C=cytosine, G=guanine), d'un sucre (ribose ou désoxyribose) et d'un, deux ou trois groupement(s) phosphate(s).

Les nucléotides ne sont pas que des composants des acides nucléiques mais ont des fonctions variées dans la cellule: par exemple l'ATP (adénosine triphosphate = adénine + ribose (l'adénosine est le nom du nucléoside) + 3 phosphates) et ses dérivés monophosphate (AMP) ou diphosphate (ADP) qui sont des molécules énergétiques intermédiaires (transfert de l'énergie chimique de liaison entre molécules) mais aussi informatives (AMP cyclique ou cAMP par exemple); ou le dGTP (adénine+désoxyribose+3 groupements phosphate; le "d" devant la molécule indiquant la nature du sucre: le désoxyribose) qui est aussi une molécule énergétique.

TD - ADN-ARN (les acides nucléiques); forme, structure des molécules; simualisation* 3D (attention applet Jmol de 540Ko à télécharger)
(* les superbes applications qui visualisent les molécules en 3D sont des simulations; pour souligner ce fait je parlerai de simualisation)


1.2 - L'ADN est une longue molécule en hélice à deux brins

L'ADN (acide désoxyribonucléique) est formé de deux chaînes (brins) de nucléotides dessinant une double hélice dont le diamètre est de 2 nm.
Dans l'ADN le sucre est le désoxyribose (et l'on parle de désoxyribonucléotides). Les bases sont A, T, C ou G.
- Les nucléotides d'une chaîne sont associés entre eux par des liaisons covalentes (entre le groupement phosphate d'un nucléotide et le désoxyribose d'un autre nucléotide).
- Les deux chaînes sont associées par des liaisons faibles entre les bases (qui forment donc des paires A avec T (2 liaisons faibles) et C avec G (trois liaisons faibles). On dit que les bases sont appariées. La molécule d'ADN est fragile est les deux chaînes peuvent facilement se séparer (l'ADN est dit dénaturé) par chauffage modéré (<50°C) et se réassocier (renaturation) si la température redescend.


1.3 - Les ARN sont des chaînes à un seul brin

Les ARN (acides ribonucléiques) sont des chaînes (un seul brin) de nucléotides pouvant se replier et s'apparier partiellement.
Les nucléotides de l'ARN, contiennent du ribose (ce sont des ribonucléotides). Les bases sont A, U, C et G. Donc l'Uracile (U) remplace toujours la Thymine (T).


2 - Les protéines sont de longs polymères d'acides aminés

Il existe 20 acides aminés dans les protéines du vivant. Ce sont des molécules organiques donc composées de C, H, O, N et parfois S. Elles ont toutes deux groupes d'atomes que l'on appelle des radicaux et qui leur donnent leur nom: un radical acide (-COOH) et un radical amine (-NH2).

Les protéines sont des peptides dont le poids moléculaire est supérieur à 10.000 daltons (un dalton est le poids d'un atome d'hydrogène).

On utilisera souvent en lycée le mot protéine comme équivalent de peptide (voir remarque ci-dessus).

TP-TD - Acides aminés et protéines; simualisation* en 3D (attention applet Jmol de 540Ko à télécharger)
(* les superbes applications qui visualisent les molécules en 3D sont des simulations; pour souligner ce fait, qui me paraît essentiel, je parlerai de simualisation)

Les protéines sont souvent formées de l'assemblage de plusieurs molécules et contiennent des éléments non peptidiques (appelés groupement prosthétique, comme le groupe tétrapyrolique à Fe qui forme l'hème et s'ajoute à la molécule de globine de l'hémoglobine... elle-même formée de 4 sous-unités identiques 2 à 2).


3. L'information génétique stable est contenue dans l'ADN et copiée dans l'ARN lors de la transcription

3.1 - La séquence des molécules polymériques constitue une information linéaire


La suite linéaire (en ligne) des nucléotides d'une chaîne de l'ADN (l'autre étant déterminée par complémentarité des bases), ou de l'unique chaîne des ARN, forme une séquence propre à chaque molécule d'acide nucléique. Elle peut être représentée par la suite des bases (par exemple .....AACTAGGCTTAA....).

De même la suite linéaire des aa d'une protéine est appelée séquence ou structure primaire.

Les séquences constituent une information linéaire qui n'est pas sans rappeler l'information exprimée par la suite de lettres d'un mot. Mais ce n'est pas la seule information que peut donner une molécule qui se déploie dans l'espace avec une forme. Même si la forme est indubitablement liée à la séquence elle n'en est pas la résultante car la forme dépend aussi des conditions de milieu et de molécules additionnelles pouvant s'ajouter pour donner une structure complexe. Par exemple l'ADN s'associe avec des protéines pour donner un chromosome chez les eucaryotes et les protéines sont nombreuses à s'associer entre elles ou avec des ARN pour donner des complexes.


3.2 - L'ADN nucléaire est transcrit en ARN par des complexes enzymatiques (ARN polymérases) au sein du noyau

La transcription est la copie de l'un des brins de l'ADN en ARN.

C'est donc la synthèse d'une molécule d'ARN (monobrin) à partir d'un l'un des brins d'une molécule d'ADN (brin matrice servant à une copie complémentaire base à base).

Lors de la transcription, la molécule d'ADN est maintenue ouverte (brins séparés) par un gros complexe enzymatique : l'ARN polymérase (ARN polymérase ADN dépendante qui contient du Zn2+) dans une zone d'une longueur de 17 paires de bases (3,4 nm pour 10 pb) ce qui nécessite, du fait de l'enroulement de l'ADN, de dérouler l'ADN en amont et de le réenrouler en aval de la zone de transcription. L'ARN polymérase copie un des brins de l'ADN (brin non codant ou brin ADN matrice ou brin transcrit) en un ARN complémentaire à une vitesse qui atteint 50 nucléotides à la seconde chez E. coli. La transcription nécessite l'ion Mg2+ et de l'énergie fournie par les ribonucléosides triphosphate (ATP, GTP, CTP et UTP).

Toutes les étapes de la transcription sont régulées par des enzymes ou des facteurs par de nombreux mécanismes qui constituent le cœur de la régulation de l'expression génétique.

 

 

Les gènes moléculaires exprimés sont transcrits et les gènes moléculaires réprimés ne sont pas transcrits.
L'expression de l'information génétique résulte directement de l'activité de transcription.
Contrôler l'expression de l'information génétique c'est d'abord contrôler la transcription.


Il existe plusieurs types d'ARN. Pour simplifier on ne parlera que des ARN messagers et des "autres ARN" pour désigner les ARN qui ne sont pas traduits.

Si l'ensemble des gènes moléculaires constitue le génome, les gènes moléculaires qui sont transcrits en ARNm (qui seront traduits à leur tour en protéines) constituent le protéome. Les gènes moléculaires transcrits mais par forcément traduits constituent le transcriptome.

Remarque:
Une molécule d'ADN peut être transcrite simultanément par plusieurs molécules d'ARN (voir par exemple Bordas doc 4 p45 ou Nathan doc2a p 52).


3.3 - Les ARN messagers (ARNm) migrent du nucléoplasme vers le cytoplasme
Les ARN messagers ou ARNm, migrent rapidement dans le cytoplasme par les pores nucléaire.


Remarques:

1 - L'ADN des mitochondries et des chloroplastes est transcrit directement au sein de ces organites.

2 - Les ARNm subissent de nombreuses maturations avant d'être éventuellement traduits.

3 - L'ensemble des ARNm d'une cellule forme le transcriptome; pour un fibroblaste humain par exemple il peut comprendre jusqu'à 300.000 molécules d'ARNm (une cellule humaine comprenant 50.000 gènes moléculaires environ mais on pense que seuls 10.000 à 20.000 d'entre eux sont actifs dans une cellule différenciée), chaque ARNm n'étant présent que sous la forme d'au maximum 15 copies. On sait détecter par la technologie des puces à ADN (DNA chips) une unique copie d'un ARNm dans un broyât cellulaire...

4 - L'information génétique contenue dans l'ARN peut passer dans l'ADN par transcription inverse grâce à des molécules de type ADNpolymérase ARNdépendante (ou transcriptase inverse): voir le cours d'immunologie de TS sur le VIH. Depuis les années 80-90 où on les recherche, on a trouvé des transcriptases inverses chez des bactéries, des mycètes et même chez les ovocytes de poissons.

5 - L'ADN peut être copié (répliqué) par des enzymes (ADN polymérase). L'ARN peut aussi être répliqué par des ARN polymérases. Au total on a donc 4 types de synthèses d'acides nucléiques: 2 réplications, isosynthèses à partir d'un brin de même nature que le brin synthétisé, et 2 hétérosynthèses à partir d'un brin matrice de nature différente.


On notera cependant que les complexes enzymatiques ARN dépendants (en rose) n'ont pas été trouvés dans toutes les cellules et que ces voies ne sont pas généralisables. Le fait qu'elles existent ouvre la voie à une nouvelle compréhension de la notion d'information génétique.


L'ARN doit être considéré comme faisant partie intégrante de l'information génétique.

Les découvertes datant de la fin du XXème siècle remettent en cause le dogme central de la biologie moléculaire d'alors selon lequel l'information génétique est contenue dans le seul ADN est exprimée dans l'ARN. L'ADN a été longtemps considérée comme la seule information génétique à caractère héréditaire étant donné qu'elle était la seule stable. Mais on a commencé à reconsidérer le statut des ARN depuis que son information peut être transmise à la cellule sous forme d'ADN par transcription inverse. On a de fait trouvé des transcriptases inverses dans de nombreuses cellules procaryotes et eucaryotes (voir travaux de Beljanski, du point de vue historique, sur une ancienne page d'histoire de la génétique...).
Récemment deux articles ont été très médiatisés à ce sujet: l'article de l'équipe française niçoise (RNA-mediated non-mendelian inheritance of an epigenetic change in the mouse, Rassoulzadegan, M. et al. Nature 441, 469-474 (2006)) et celui d'une équipe américaine travaillant sur les plantes (Genome-wide non-mendelian inheritance of extra-genomic information in Arabidopsis, Lolle, S. J., Victor, J. L., Young, J. M. & Pruitt. R. E. Nature 434, 505-509 (2005), même si les résultats sont très controversés*.

L'article de S. Lolle et R. Pruitt met en lumière le fait considéré comme de plus en plus courant qu'il existe des réversions de certains gènes associés à des protéines. Une réversion apparemment dirigée ou paramutation consiste chez un individu présentant un gène muté identifié, à récupérer (par un procédé inconnu mais les auteurs proposent l'hypothèse d'une matrice d'ARN transmise par une hérédité non mendélienne...), au bout de quelques générations, une ou deux copies du gène ancestral non muté. La fréquence des réversions peut atteindre quelques dizaines de % des descendants. Ici, ces chercheurs ont travaillé sur le modèle génétique usuel qui est une petite plante: Arabidopsis thaliana, à partir d'un gène HOTHEAD (HTH) associé à une protéine ACE (ADHESION OF CALYX EDGES) de 594 aa intervenant dans la signalisation cellulaire et située pour une bonne part vers l'extérieur de la cellule; cette protéine possède une activité enzymatique (de type mandelonitrile lyase qui semble être une propriété très générale de nombreuses protéines extracellulaires... voir La Recherche, 386, mai 2005, pp14-15). Le gène HTH associé est exprimé dans les fruits, les racines, l'inflorescence, les fleurs, la feuille et la tige; on, connaît une impressionnante liste de 22 mutants dont ceux étudiés par cette équipe. La quasi intégralité (il manque au moins quelques figures...) de l'article en anglais peut être consultée à l'adresse: http://www.euchromatin.com/Pruitt01.htm mais il ne peut s'adresser qu'à des enseignants de SVT ayant un bon niveau de génétique et je ne pense pas qu'il apporte quelque lumière supplémentaire. Il peut être complété par les données du site http://www.arabidopsis.org/ pour les gènes clonés et leurs produits.


*Les résultats obtenus semblent pouvoir s'expliquer par une très forte propension du mutant utilisé à subir une fécondation externe (alors que cette plante est normalement quasi-strictement autogame). Des critiques ont été publiées récemment. Malgré tout l'idée d'une information génétique extrachromosomique, portée par de l'ARN, et fortement suggérée par d'autres travaux et elle est bien toujours d'actualité.

pages sur les génomes
(en cours de rédaction)

 

 

Voir la traduction de l'article d'Helen Pearson: Qu'est-ce qu'un gène ?


4 . L'information génétique transitoire des ARNm est traduite en polypeptides (à l'aide d'autres ARN) dans les ribosomes du cytoplasme

Les ribosomes sont de petits (20 nm environ, un peu plus petits chez les procaryotes, un peu plus gros chez les eucaryotes) complexes ARN-protéines composés de 2 sous-unités qui s'assemblent lors de la traduction.

Les ribosomes sont associés à un ARNm en polysomes. Un polysome se présente au MET comme une chaîne (parfois fixés au MET sous la forme d'une spirale) de ribosomes le long d'une molécule d'ARNm qu'ils traduisent.
Les polysomes sont soit libres dans le cytoplasme, soit associés à la surface du RE sacculaire qu'on appelle alors REG (reticulum endoplasmique granuleux ou granaire).

Lors de la traduction les aa sont présentés aux ribosomes sous une forme activée (qui nécessite de l'ATP) et associés à des ARN transporteurs-adaptateurs (de transfert = ARNt). Ils sont liés progressivement les uns aux autres par des liaisons covalentes (peptidiques) dans l'ordre déterminé par l'ARNm. En effet, chaque triplet de base de l'ARNm (codon) est associé à un aa activé grâce à son ARNt transporteur-adaptateur spécifique. La correspondance entre les codons de l'ARNm et les aa constitue le code génétique.

Le code génétique est universel (toutes les systèmes de traduction cellulaire utilisent les mêmes correspondances codon-aa). Cette universalité n'est pas absolue mais la rareté des exceptions (par exemple dans les mitochondries) prouve au contraire que ces exceptions sont plutôt des optimisations que des dérogations à la règle (il n'y a qu'une dizaine d'aa dans les peptides traduits dans la matrice mitochondriale et les ARNt mitochondriaux sont issus du génome mitochondrial) prouve au contraire l'importance de l'universalité du code: tout changement a des conséquences très graves pour le sens de l'information génétique de la cellule.
Le code génétique est parfois dit dégénéré car notamment redondant (plusieurs codons correspondent à un aa) (mais ce terme se réfère à une étape antérieure qui n'a probablement pas existé) et ponctué (codon initiateur et codon stop; mais ce terme se réfère à l'expression du message et non au code lui-même).

Remarque: Les mitochondries et les chloroplastes possèdent des ribosomes qui réalisent la traduction des ARNm directement dans leur compartiment matriciel. De nombreuses protéines des ces compartiments possèdent des sous-unités codées à la fois par le génome nucléaire et le génome mitochondrial ou chloroplastique.

Les ribosomes lient les aa correspondant à deux codons successifs puis progressent le long de l'ARNm en se décalant d'un codon. La traduction comporte un phase d'initiation (codon initiateur AUG correspondant à la Met), une phase d'élongation (20 aa par seconde environ), et une phase de terminaison (codon stop: UGA, UAA, UAG). La traduction est un mécanisme métabolique qui consomme de l'énergie (GTP) et qui est contrôlé par de nombreuses enzymes.

Les ARNm sont traduits plusieurs fois avant d'être détruits.

La plupart des protéines sont organisées en complexes fonctionnels qui s'auto-assemblent sous le contrôle d'enzymes et de facteurs spécifiques (par exemple les molécules chaperons qui assurent le repliement de certaines protéines...).


Les enzymes doivent être étudiées autre part dans le cours mais il est probablement judicieux de présenter la transcription comme une réaction enzymatique

Un exemple d'enzyme particulièrement simple à comprendre est celui des ribosomes. Ces particules sont maintenant très bien connues et l'on peut affirmer que d'une part ce sont bien leur propriétés topologiques qui leur confèrent leur fonction et d'autre part que ces complexes ARN-protéines sont restitués intégralement sans altération en fin de réaction (ce que l'on appelle le cycle ribosomial): ces deux propriétés en font des enzymes au sens général. À ce sujet on dit souvent que les ribosomes sont les catalyseurs de la synthèse protéique, ce qui correspond bien à les apparenter à des enzymes.

La synthèse des protéines, une réaction enzymatique catalysée par les ribosomes, l'ARNm, les ARNt et de nombreux cofacteurs de traduction
Les ribosomes des mitochondries et chloroplastes des eucaryotes sont très voisins de ceux des procaryotes (on leur suppose une parenté) mais ceux du cytoplasme des eucaryotes sont assez nettement différents et possèdent aussi des cofacteurs différents. Les facteurs présentés ici sont ceux des ribosomes des procaryotes.
Simplifié d'après EU - v10

n aai (1,n)+ 4 GTP < ----------> (Met + aai (2,n-1)+ aan) + 4 GDP + 4Pi
(enzymes: ARNm, ribosomes, ARNt, cofacteurs)

le GTP, guanosine triphosphate, est un ribonucléotide énergétique tout comme l'ATP, adénosine triphosphate qui est le ribonucléotide le plus courant dans la cellule; la méthionine (Met) est le premier acide aminé (aa) de toute chaîne polypeptidique (qui comporte n aa ici). C'est un domaine particulier de la grande sous-unité ribosomiale (la peptidyl-transférase) qui catalyse l'établissement de la liaison peptidique. On notera que le ribosome (avec ses 3 (chez les procaryotes) ou 4 (chez les eucaryotes) molécules d'ARNr; et ses quelques 53 (82) protéines) possède des sites de fixation de tous les cofacteurs, de l'ARNm et des complexes aa-ARNt.

exemple détaillé dans la page sur les enzymes



Les étapes de la transcription sont légèrement plus détaillées que l'exige le strict respect du programme: cependant seuls les ARNt formant des complexes avec les aa transportés sont représentés, ce qui me paraît indispensable à la compréhension de la traduction; pour éviter toute polémique stérile vous pouvez les appeler "ARN adaptateur-transporteur d'aa". Les étapes de la traduction sont les suivantes: 1 - assemblage des 2 sous-unités ribosomiales autour de l'ARNm; 2 - arrivée et mise en place d'un aa (transporté par son ARN adaptateur-transporteur) qui correspond selon le code génétique au codon de l'ARNm placé à la base du premier site de fixation des ARN transporteurs-adaptateurs dans le ribosome; on notera que le premier aa est toujours une méthionine (Met) car le premier codon (initiateur) est toujours AUG; 3 - arrivée d'un autre aa transporté par un ARN adaptateur-transporteur dans le second site ribosomial; 4 - établissement d'une liaison peptidique entre les deux aa accolés; 5 - déplacement du ribosome d'un codon le long de l'ARNm; 6 - ce qui implique le départ de l'ARN transporteur adaptateur qui se détache du peptide en cours de formation et un changement de site ribosomial pour l'autre ARN transporteur-adaptateur qui porte la chaîne peptidique en formation; 7 - après de nombreux cycles d'élongation, lorsque un codon STOP (UAG, UGA, UAA) devient accessible dans le second site ribosomial, un complexe vient se fixer sur ce codon et provoque la terminaison de la traduction, c'est-à-dire la libération de la chaîne peptidique et de l'ARN transporteur-adaptateur et la séparation des sous-unités ribosomiales.


5. Les peptides exportés subissent une maturation dans le REL puis dans l'appareil de Golgi avant d'atteindre la membrane ou d'être sécrétés par exocytose

 

Les peptides synthétisés dans le cytoplasme sont directement utilisés par la cellule pour le métabolisme (dans des enzymes...) ou pour des structures (histones...) (voir tableau).

Les peptides synthétisés à la surface du REG migrent dans le REL (reticulum endoplasmique lisse, qui est tubulaire) puis dans l'appareil de Golgi et sont exportés dans des vésicules soit vers le membrane (protéines membranaires) soit vers l'extérieur de la cellule (protéines sécrétées par exocytose).

C'est par exemple dans l'appareil de Golgi que sont accrochés les sucres (résidus glucidiques) des glycoprotéines.


6. Les gènes ne représentent qu'une petite partie de l'ADN des eucaryotes

Un gène moléculaire est défini par sa nature chimique (ADN), sa séquence (suite de monomères) et sa fonction (servir de copie lors de la transcription).

Si l'on considère que les gènes moléculaires contiennent une information, cette information est linéaire. De plus, comme la seule fonction connue précisément de l'ADN, découpé en gène moléculaires, est une fonction passive: servir de modèle lors de la transcription, l'information génétique est donc une information pour une molécule (d'ARN).

L'expression de l'information génétique stable de l'ADN passe d'abord par l'ARN puis peut passer par un polypeptide.
Par extension on peut aussi dire que l'information génétique comprend la séquence des protéines traduites à partir des ARN.
Comme on sait que l'ARN peut être rétrotranscrit en ADN l'information instable de l'ARN peut être stabilisée dans l'ADN.

Les gènes moléculaires sont donc des segments d'ADN contenant une information linéaire exprimée dans une molécule de type ARN lors de la transcription puis, le plus souvent, dans une molécule peptidique lors de la traduction.
Ce sont des unités fonctionnelles de l'information génétique.
L'information génétique est la séquence de l'ADN ou de l'ARN ou encore des protéines.

Le contrôle de l'expression de l'information génétique peut se faire au niveau de la transcription ou de la traduction.

pages sur les génomes
(en cours de rédaction)

Le nombre de gènes moléculaires des différentes cellules vivantes n'est pas précisément connu. Je vous rappelle que séquencer la totalité de l'ADN d'une cellule ne veut par dire séquencer le génome (ensemble des gènes) car on n'est pas du tout sûr que tout l'ADN (des eucaryotes surtout) est organisé en gènes moléculaires. On estime à 2000 ou 4000 le nombre de gènes moléculaires d'Escherichia coli, 6340 celui de Saccharomyces cerevisiae, 10.000 celui des cellules de Drosophila melanogaster et peut-être 100.000 ou 50.000 pour l'homme.

Un gène moléculaire peut correspondre à plusieurs produits et inversement un produit peut nécessiter plusieurs gènes moléculaires, les gènes moléculaires peuvent se chevaucher... bref, ceci est une autre histoire: celle de la génomique (science des gènomes) ou biologie moléculaire du gène moléculaire (avec sa nouvelle branche: la protéomique qui s'intéresse aux seuls gènes moléculaires contenant une information pour des protéines) et elle ne fait que commencer (voir histoire de la génétique).

Malgré le séquençage complet du génome humain on n'espère au mieux que 25.000 gènes moléculaires associés à des protéines. Si on ajoute les quelques 2.000 gènes moléculaires associés à des ARN non traduits cela fait un peu court pour que l'imaginaire continue de voir dans les protéines autre chose qu'un support matériel de la vie. Quand au "pouvoir magique" du gène moléculaire il s'estompe petit à petit.

Remarque:

Certains bioinformaticiens, cherchant à chiffrer le niveau de complexité du vivant, considèrent qu'il y a encore 7 ordres de grandeur à atteindre avant de pouvoir rendre compte du niveau cellulaire (génomique comparative, interactions rigides, génome, métabolisme et signalisation unicellulaire, interactions flexibles, complexes protéiques, métabolisme et signalisation pluricellulaires, interactions des complexes protéiques). À mon avis le problème est pris à "rebrousse poil". La vie, dans sa complexité, peut être supportée par des formes simples dans des espaces de contrôle multidimensionnels. Il semble nécessaire de cesser de raisonner dans un espace à deux dimensions avec une infinité de formes. La théorie des modèles (géométrique) de René Thom permet de complexifier l'espace pour simplifier les formes. Ce qui est moins intuitif mais très compréhensible au moins jusqu'à la dimension 4.

ADN dont la fonction semble connue
ADN dont la fonction est inconnue
protéome
ADN transcrit (en ARNm) et traduit en protéines
1,2%

régions de contrôle
qq %

introns* des gènes protéiques

31%
régions non traduites des ARNm (UTR)

0,7%
ADN transcrit non traduit (ARN non ARNm; ARN ribosomiaux, de transfert, petits ARN et microARN...)
0,05%

ADN satellite**

6,5%
ADN intergénique

60%

TOTAUX estimés

~ 10%
~ 90%

Le génome humain (au sens large de la totalité de l'ADN nucléaire d'une cellule humaine) de 3,1 milliards de paires de bases contiendrait 20.000 à 25.000 gènes protéiques....(Pour la Science, dossier n°46, 2005, p 18)


* les introns sont des séquences d'ADN transcrites des gènes protéiques mais qui sont coupées lors de la maturation des ARNm et ne participent pas à la formation de l'ARNm qui est traduit.

ADN non répété

49,5%

ADN répété

50,5 %

ADN satellite** 6,5 %
éléments transposables

44 %

information génétique sous forme d'ADN
transposons***
3 %
information génétique sous forme d'ARN

gène d'une transcriptase inverse intégré à l'élément

rétrovirus endogènes****
8 %
autres
33 %

** l'ADN satellite sont des régions répétées des millions de fois de quelques centaines de paires de nucléotides; elles sont souvent localisées près du centromère du chromosome mais peuvent occuper un bras entier. Ces séquences sont variables entre individus, même d'espèces voisines. Si l'ADN satellite représente 6,5% de l'ADN humain, 50% de l'ADN humain est répété. Les éléments transposables représentent ainsi 44 % de l'ADN ; on y trouve pour 3% des transposons*** (fragments d'ADN qui se déplacent directement dans l'ADN en s'intégrant ou en se coupant), pour 8 % des éléments possédant des LTR (longues répétitions terminales) aux deux extrémités et qui se comportent comme des rétrovirus (car ce sont des séquences d'ADN qui contiennent le gène d'une transcriptase inverse et qui se déplacent dans l'ADN par l'intermédiaire d'une forme ARN retrotranscrite) - on les qualifie de rétrovirus endogènes**** - et pour 33% d'autres éléments qui contiennent aussi une transcriptase inverse. La plupart des élément transposables sont non fonctionnels. On pense que ce sont les vestiges de gènes ou de séquences qui se sont déplacés chez des ancêtres plus ou moins lointains.


Cette présentation ne tient pas compte des récents résultats qui estiment que 63% du génome de la souris serait effectivement TRANSCRIT, de façon continue, en donnant des ARN de taille très variable. Cette énorme masse d'ARN "non-sens" pose d'intéressantes questions. Voir la traduction de l'article d'Helen Pearson: Qu'est-ce qu'un gène ?

Il existe un deuxième niveau de compréhension de la fonction du gène moléculaire car les gènes ne sont pas juxtaposés, figés et isolés mais sont emboîtés (plusieurs produits peuvent être synthétisés à partir d'un seul gène selon l'environnement), dynamiques (le début et la fin du gène peuvent varier, le génome d'une cellule évolue avec son âge...), et interdépendants (l'expression d'un gène est sous le contrôle d'autres gènes et souvent sous le contrôle de ses produits (rétrocontrôle)...). Mais cette complexité, qui fait appel notamment à la science des réseaux, dépasse de loin le niveau du lycée.
Pour rééquilibrer le chapitre, il serait donc nécessaire de rédiger une partie, autrement plus développée que celle sur le gène, et qui pourrait s'intituler: génomes
(elle est en cours de rédaction). De l'universalité des gènes on est passé à l'universalité des génomes (avec les mots de Denis Duboule).


Note: certains peptides sont synthétisés par une autre voie que la voie ribosomiale :
par exemple certains antibiotiques qui sont de petits peptides (avec des acides aminés L et D et des structures cycliques...). La gramicidine S bactérienne est ainsi synthétisée par de gigantesques enzymes (plus de 15.000 aa; la plus longue chaîne polypeptidique connue...) qui fait partie des peptide synthétases non ribosomiques ou NRPS (Non Ribosomial Peptide Synthetase). Les NRPS ont été étudiés (discrètement !) depuis les années soixante. Les progrès de la biologie moléculaire ont maintenant permis de couper ces énormes molécules en modules actifs et, en insérant leurs gènes dans des cellules procaryotes hôtes, leur faire synthétiser des peptides antibiotiques "à façon" (Demain, des antibiotiques à façon ?, Mohamed Marahiel, Nadine Kessler et Uwe Linne, 2003, La Recherche, 370, décembre 2003, p 54-58).
retour

Annexe :


pour en finir avec les confusions nées de l'emploi des termes génotype, phénotype, allèle et gène dans le sens héréditaire, chez les procaryotes et les eucaryotes

ancienne page

L'histoire commence en 1902 avec la définition des gènes (héréditaires), des allèles, du génotype (héréditaire) et du phénotype (héréditaire) chez les EUCARYOTES (Bateson, voir cours de terminale spécialité).

L'histoire semble se simplifier avec l'avènement d'une biologie moléculaire des années 1960 fondée sur le rôle de l'ADN dans la synthèse des protéines principalement à partir de travaux sur les PROCARYOTES - au début du moins. Les termes de gène moléculaire, "allèle", "génotype" et "phénotype" sont redéfinis dans une vision globale du vivant (voir cours, parties historiques 1.1 et 1,2).

Mais près de un demi-siècle plus tard ces deux visions ne sont toujours pas unifiées. Il y donc vraiment un fossé entre ces deux visions.
Le problème peut être résumé en une remarque:
il n'y a pas de prédiction du phénotype par le génotype . Cette phrase n'a de sens bien sûr qu'en utilisant l'analogie moléculaire; le "phénotype" et les "génotype" correspondant à des éléments moléculaires (voir tableau ci-dessous). On peut aussi formuler ce problème en affirmant que ce qui s'applique aux procaryotes ou aux eucaryotes unicellulaires ne s'applique pas simplement aux pluricellulaires.


On peut donc supposer une erreur de méthode (du discontinu au continu). C'est ce qui a fait redémarrer les études biologiques intégratives et la physiologie quelque peu abandonnées au profit de la biologie moléculaire.

Voici un tableau qui résume ces deux visions (il était présenté dans l'ancien cours de seconde):
Le but n'est pas d'embrouiller un élève mais l'aider à comprendre ce qui n'est pas dit par l'auteur d'un texte qui emploie des mots avec un sens caché...

définition HISTORIQUE claire
sens analogique
sens analogique étendu
théorie chromosomique de l'hérédité
théorie biochimique de l'hérédité (par l'ADN)
gène

Un gène héréditaire est une portion de chromosome associée à la transmission d'un caractère héréditaire (uniquement chez les eucaryotes)

Un gène moléculaire est un segment d'ADN transcrit en ARN et éventuellement en protéine (aussi bien chez les procaryotes que chez les eucaryotes)

allèle

Un allèle est la forme d'un gène héréditaire.

AUCUN sens analogique légitime
(ne pas employer "allèle" pour désigner une séquence d'un gène moléculaire)
génotype

L'ensemble des formes d'un gène héréditaire constitue le génotype d'un gène héréditaire.

Par ANALOGIE les séquences d'un gène moléculaire constituent le génotype de ce gène moléculaire.

Le génotype moléculaire d'une cellule désigne PAR EXTENSION toutes les séquences de tous ses gènes moléculaires.

phénotype

Le phénotype d'un gène héréditaire c'est la forme visible de ce gène, c'est-à-dire les caractères visibles associés à la possession de ce gène.

Le phénotype moléculaire d'un gène désigne PAR ANALOGIE la forme visible de ce gène moléculaire au niveau de la cellule, c'est-à-dire l'ensemble des produits (ARN et peptides) résultants de sa transcription et éventuellement de sa traduction.

PAR EXTENSION le phénotype moléculaire d'une cellule désigne l'ensemble de tous les produits de tous ses gènes moléculaires.

Remarques:

* Cependant il ne faut pas "jeter le bébé avec l'eau du bain". Non pas abandonner l'hérédité chromosomique mais la redécouvrir avec des théories qui ne ne se basent plus sur la vision simpliste d'un molécularisme (qui n'existe plus dans son expression caricaturale). On peut par exemple lire l' « Avant propos » de Michel Morange, Pour la Science, Dossier n°46, janvier-mars 2005, p 2-3 pour voir que derrière l'abandon de la vision simpliste, on rechigne encore à se lancer dans une véritable biologie théorique "à la René Thom".

* au sujet de la notion de phénotype alternatif. Ce terme n'apparaît à ma connaissance que dans les documents d'accompagnement du programme (tapez-le sous Google...) et est repris par le Nathan notamment; il est définit officiellement de la façon suivante : « les phénotypes alternatifs sont les variations d'un même caractère présentées par divers individus de la même espèce ». Si l'on s'entend sur la notion de caractère héréditaire (sous-entendu mendélien ou morganien), un phénotype alternatif c'est un allèle, forme (ou variation) d'un gène héréditaire, support d'un caractère héréditaire. Il est intéressant car, bien qu'inemployable, il montre que ses concepteurs ont vu qu'il y avait un problème insoluble si l'on choisissait de nommer "allèle", la séquence d'un gène moléculaire. Si toute caractéristique est phénotypique, tout phénomène (sauf l'ADN) est phénotype: on revient à la stricte étymologie. Mais alors le mot ne signifie plus rien car l'ADN est aussi phénotype. Il me paraît essentiel de dire que le terme phénotype n'a de sens que dans le cadre d'une théorie héréditaire.

* l'épigénétique désigne chez les généticiens "ce qui modifie le génétique" (au sens de support de l'information génétique, c'est-à-dire l'ADN ou l'ARN) et vient de la cellule ou d'une autre cellule: les biologistes moléculaires désignent ainsi une information postgénétique, reposant principalement sur des méthylations de l'ADN et le rôle des histones dans l'expression de l'ADN. On trouve ainsi récemment dans la littérature le terme d'épigénome. Mais pourquoi limiter l'épigénétique au postgénétique ? Dans le cadre d'une génétique moléculaire, celle des procaryotes, TOUT EST GÉNÉTIQUE car le génétique est assimilé à la synthèse des protéines (mais peut-être pas de toutes) que l'on trouve partout dans la matière vivante. Comme les gènes moléculaires sont eux mêmes dans un cytoplasme cellulaire, lui-même dans un environnement extracellulaire : le fonctionnement des gènes est épigénétique et donc TOUT EST ÉPIGÉNÉTIQUE. Belle avancée théorique. Historiquement, à ma connaissance, ce terme renvoie d'une part à celui d'épigénèse (épigénétique est alors équivalent d'épigénésique - l'épigénèse étant un processus de transformation progressive de l'être vivant au cours du développement par opposition au préformisme (ou évolutionnisme, dans le sens ancien, voir deux articles sur une page de textes sur l'évolution). D'autre part, mais toujours dans ce sens de lié au développement, le terme d'épigénèse se superpose assez facilement a celui d'acquis par opposition à l'inné; on le retrouve notamment dans les travaux faisant référence au développement psychique de l'enfant (Piaget, Freud) ou la neurologie d'une façon plus générale. Enfin, et d'une façon encore différente, on peut citer la notion de "paysage épigénétique" due a Waddington (voir page annexe). Sans prétendre faire œuvre d'historien je crois que l'on peut dire que les différents sens récents d'épigénétique se recoupent comme étant une référence au modèle épigénétique du développement, actuellement dominant.

Ancienne représentation utilisée auparavant en classe de seconde :

Gène moléculaire et gène héréditaire NE SONT PAS DES NOTIONS SUPERPOSABLES

Les progrès de la biologie moléculaire ayant été fait sur des procaryotes il a été facile d'imaginer que l'ADN circulaire de la bactérie qui comporte des gènes moléculaires linéairement alignés était le reflet de l'alignement des gènes héréditaires sur le chromosome eucaryote. Mais c'est aller un peu vite. Il y a à entre 10 et 1.000 ordres de grandeur entre la taille d'un gène moléculaire et celle d'un gène héréditaire. C'est pourquoi il est important de laisser la place à des théories qui essayent de structurer le chromosome autrement qu'avec une seule gigantesque molécule où les gènes moléculaires seraient alignés.

Il y a clairement une incapacité de la biologie moléculaire à définir quand la variation dans la séquence d'ADN, par mutation par exemple, cesse d'autoriser à parler de variation d'un même gène moléculaire ou d'apparition d'un nouveau gène puisque la fonction de l'ADN est passive (l'ADN est transcrit).
Dans le cadre de la théorie chromosomique de l'hérédité, un allèle désigne un trait de caractère héréditaire. On exprime par le terme d'allèle la variations des traits de caractères reliés à un même gène héréditaire. On ne peut relier ce trait de caractère à une gène moléculaire qu'en supposant une liaison unique et causale entre l'ADN et le trait de caractère.

Ces notions d'allèle, de génotype et de phénotype ne sont pas valables pour les procaryotes mais uniquement pour les eucaryotes qui ont des chromosomes. Pour un organisme qui possède un nombre pair de chromosomes (on dit "diploïde") hérités pour moitié d'un organisme paternel et pour moitié d'un organisme maternel, les allèles sont les formes différentes de chaque portion de chromosome ou gène héréditaire portés par des chromosomes homologues. Les chromosomes homologues portant alors les mêmes gènes héréditaires aux mêmes emplacements (c'est toujours la théorie chromosomique de l'hérédité mais cela n'est ABSOLUMENT PAS UN RÉSULTAT DE LA BIOLOGIE MOLÉCULAIRE. On ne voit pas de gène moléculaire sur un chromosome. Les sondes fluorescentes (FISH) ne peuvent pas localiser des gènes moléculaires comme cela est parfois écrit dans les manuels scolaires. Ils se fixent uniquement sur des séquences répétitives d'ADN. On n'est pas au même niveau de compréhension du chromosome. Le gène héréditaire comprend des millions de paires de bases et est probablement relié à de très nombreuses segments d'ADN (circulaires ?) et donc de très nombreuses protéines et donc de très nombreux gènes moléculaires. Mais la liaison est loin d'être claire et il est tout à fait probable qu'il n'y ait pas de disposition linéaire des gènes au niveau d'un ADN déroulé identique à celle de l'ADN condensé chromosomique.

À chaque fois que vous lirez allèle (dans vos manuels scolaires, dans un article de journal, dans un exercice scolaire...) vous comprendrez que l'on veut souvent parler de la séquence d'un gène moléculaire. Cette définition est fausse. Vous auriez intérêt à garder celle donnée au collège de "portion de chromatide" qui est incomplète mais exacte car elle fait bien référence au chromosome des eucaryotes. Et utiliser le terme de génotype moléculaire à la place d' "allèle moléculaire", ce qui ne veut vraiment rien dire.

ces pages demandent des connaissances de terminale


Deux exemples ont été détaillés pour montrer l'obsolescence de la liaison génotype-phénotype enseignée la plupart du temps:
- l'
alcaptonurie, qui ne doit plus être enseignée comme une maladie à transmission héréditaire autosomale récessive
- et la
phénylcétonurie, plus complexe, mais pour laquelle la liaison génotype-phénotype reste réfractaire à l'exploration expérimentale.
Un bon article (court et simple) utilisable en classe qui présente correctement le lien entre trois gènes associés et la maladie d'Alzheimer.
(version formatée, version texte html): Marie-Laure Théodule " Maladie d'Alzheimer : trois nouveaux gènes identifiés " La Recherche n° 435, novembre 2009, pp 8-10