De la structure à la fonction d'une protéine : l'hémoglobine

... et du délicat usage des notions de génotype et de phénotype pour cette molécule

Hb heme in Wikipedia
L'hémoglobine est une protéine complexe (hétéroprotéine) car elle ne contient pas que des acides aminés. Elle possède, en plus des acides aminés de ses 4 chaînes protéiques (les globines), identiques 2 à 2, 4 groupes prosthétiques ou hèmes (avec un atome de Fe), chacun étant lié à une globine (par deux His) et situé dans une poche hydrophobe.
Le terme "hémoglobine = Hb" désigne la protéine complète avec ses 4 chaînes de globine et ses 4 hèmes.
L'hème est un groupe tétrapyrollique (protoporphyrine); voir ci-contre ->
Il existe plusieurs types d'hème associées à différentes protéines.
L'hémoglobine se trouve dans les globules rouges (hématies ou érythrocytes) qui la synthétisent lors de leur période de différenciation. Une faible part est plasmatique et associée à des protéines suite à la dégradation des globules rouges ou hémolyse.
L'Hb plasmatique se fixe à l'haptoglobuline (Hp) synthétisée par le foie. Des dimères de chaîne A de globine s'y associent.
L'Hb est principalement synthétisée chez l'adulte dans les cellules de la moelle osseuse des os longs qui fabriquent les futurs globules rouges (érythroblastes).  L'hème est synthétisé dans le cytoplasme et les mitochondries des érythroblastes. Lorsque le globule rouge est libéré dans le sang (réticulocyte pendant 2 jours, puis érythrocyte) il n'a plus de noyau et ne peut donc plus synthétiser de protéines, sauf à partir d'ARNm résiduels (au stade réticulocyte). Il garde cependant toujours une activité enzymatique dont le transport du dioxygène et du gaz carbonique. Sa durée de "vie" est de 120 jours, avant d'être phagocyté par des cellules immunitaires (macrophages) de la moelle osseuse, de la rate et du foie.

Cette page présente plusieurs niveaux de lecture (acessibles en cliquant sur les ▶︎) : les bases scolaires de biologie moléculaire et de physiologie du niveau lycée sont sur fond fond jaune. Je me suis efforcé de nommer les gènes avec des lettres grecques et les protéines avec des lettres majuscules arabes, conformément à l'usage moderne.
Une discussion des bases scolaires de l'interprétation génétique dans le cadre de la théorie de l'information génétique ou du programme génétique, sont sur fond orange.
Quelques sources : - site Planet-Terre (résumé qui date un peu; page sur les mutations des gènes de l'hémoglobine dans une perspective évolutive darwinienne très scolaire : famille multigénique, duplication, mutations ponctuelles).
- sur ce site, pour un aperçu des différentes formes d'Hb, voir l'ancienne page du cours de spécialité des années 2000
- pour un aperçu plus récent voir l'Atlas of Genetics and Cytogenetics in Oncology and Haematology - page en français
- pour ceux qui recherchent l'exhaustivité voir http://globin.cse.psu.edu.
- une page en français du CHU d'Angers bien faite sur les maladies du sang (drépanocytose, thalassémies et hémoglobinoses)
- les pages JSMOL sur l'Hb de Gille Gutjahr sont un excellent outil dont j'ai utilisé quelques scripts (site  http://molec3d.lyceesaviodouala.org).

1 - De la séquence des nucléotides de l'ADN à la séquence des acides aminés

chaines de l'Hb
Les gènes des chaînes de globine de l'hémoglobine sont regroupés en deux groupes (clusters) positionnés sur deux chromosomes différents :
- les gènes du groupe α codant pour les chaînes de type A sont sur le chromosome 16,
- alors que ceux du groupe β codant pour les chaînes de type B sont sur le chromosome 11.

Dans l'illustration ci-contre --> j'ai volontairement limité le nombre de gènes (image plus complète). Le groupe LCR dans le groupe β désigne des gènes régulateurs (locus control region).
Au cours de la vie embryonnaire ce sont les chaînes A et Z viennent du groupe α alors que les chaînes E, G et B sont synthétisées à partir du groupe β. Les gènes α1 et α2 sont identiques et donc les chaînes A1 et A2 ont la même séquence.
Chez le fœtus les chaînes A sont dominantes pour le groupe α et les chaînes G pour le groupe β.
À la naissance, laors que les chaînes A restent presque exclusives pour les gènes du groupe α, on observe un basculement pour les chaînes issues des gènes du groupe β : les chaînes G diminuent alors que la chaîne B devient majoritaire (avec un peu de chaîne D).


Il existe une très grande variabilité individuelle et populationnelle des différentes chaînes de l'Hb, même à l'état adulte. Chez un adulte on trouve habituellement :
- 97% de molécules d'HbA1 - AABB notées A2B2 (2 chaînes A et 2 chaînes B)
- 3% de molécules d'HbA2 - AADD notées A2D2 (A2D2= 2 chaînes A avec 2 chaînes D) et plus rarement d'HbF (<1%) AAGG notées A2G2 (A2G2= HbF, hémoglobine fœtale =  2 chaînes A et 2 chaînes G). Il n'y a pas de différence d'efficacité entre ces 3 molécules d'Hb (HbA1, HbA2 et HbF). Si les chaînes A et B diffèrent par plusieurs dizaines d'aa (voir ci-dessous), les chaînes G diffèrent entre elles par un unique acide aminé en position 136, alanine pour G1 et glycine pour G2.

Pour les chaînes anormales (hémoglobinoses et thalassémies) et les maladies (hémoglobinopathies), voir la 4e partie de cette page.
gens alpha et beta de l'Hb
La structure de tous les gènes de globine est similaire (<- image ci-contre), trois exons et deux introns (avec des régions répétées en 3' et en 5' = flanking regions), la principale différence étant que le deuxième intron est beaucoup plus long que le premier dans la famille ß (intron 1 = 120-140pb, intron 2 = 900 pb) alors qu'ils sont du même ordre de grandeur, moins de 150 pb (paires de bases), dans la famille α. Du fait de la présence de ce long exon les gènes de type β sont donc deux fois plus longs que les gènes du groupe α.
Les transcrits primaires subissent un épissage et l'ajout d'une coiffe et d'une queue puis migrent dans le cytoplasme de l'érythroblaste.
La traduction à lieu au niveau de polysomes libres dans le cytoplasme.
Les chaînes de globine fixent d'abord leur hème avant de s'assembler en tétramère pour former les molécules d'hémoglobine.
Les gènes associés à la synthèse de l'hème sont ceux des enzymes qui interviennent dans sa synthèse; par exemple la ferrochélatase (⎋FECH) qui lie le Fe2+ à la protoporphyrine, elle-même synthétisée en plusieurs étapes à partir d'un produit mitochondrial,  le succinyl-CoA, et la glycine, un aa.  sous le contrôle de 7 enzymes supplémentaires dont les gènes sont situés sur différents chromosomes (1, 3, 9, 10, 11 et 18). 




La structure primaire  désigne la séquence ou l'ordre des aa de chaque chaîne. Les chaînes de type A ont 141 aa et les chaînes de type B 146 aa.
Pour comparer les séquences il faut utiliser des logiciels, par exemple ceux accessibles en ligne (comparaison de 2 séquences ou plus). Choisir d'abord les séquences à comparer (par exemple ici en entrant le code PDB (ou Uniprot) des protéines à comparer :2hhb qui est de la forme HbA1 ou AABB ou A2B2), puis copier les séquences dans la page de calcul (deux premiers résultats de la page).
comparaison HbAB
Ici les aa sont représentés par leur lettre et les alignements sont optimisés par le logiciel : * signifie 2 aa identiques (il est clair qu'il existe d'autres solutions, même si elles sont considérées comme moins pertinente car présentant une différence nécessitant un "chemin" plus long). On voit ainsi que les deux chaînes A et B de cette  l'Hb humaine sont très voisines (60 aa alignés identiquement). Ces similitudes sont interprétées en terme d'évolution moléculaire (duplication de gènes et variation allélique).
Tableau comparant les séquences des chaînes A, B, D, G1 et G2
comparaison des séquences des chaînes A B D G1 G2
A id 2aa en plus pour A et 7(1+6) aa en plus pour B, ce qui fait au total 141 aa pour A et 146 aa pour B;
60 aa identiques en même position soit 43% d'homologie
2 aa en plus pour la chaîne D et 7 aa en moins pour la chaîne A
59 aa identiques/145 soit 41% d'homologie
2 aa en plus pour la chaîne G1 et 7 aa en moins pour la chaîne A
56 aa identiques/145 soit 40% d'homologie
2 aa en plus pour la chaîne G2 et 7 aa en moins pour la chaîne A
56 aa identiques/145 soit 40% d'homologie
B
id 10 aa différents sur 146
93% d'homologie
107 aa identiques /146 soit 73% d'homologie 108 aa identiques /146 soit 74% d'homologie
D

id 41 aa différents sur 146 soit 72% d'homologie 40 aa différents sur 146 soit 73% d'homologie
G1


id identiques sauf 1aa n°136 (G2 possède une Gly à la place de l'Ala pour la chaîne G1) - 99% d'homologie
G2



id
La composition des Hb synthétisées ne peut pas constituer un phénotype moléculaire.
Cette question est délicate car on a vite fait de confondre les notions héréditaires (liés à l'individu) et celles définies aux niveaux cellulaires et moléculaires.
Dans l'hérédité mendelienne-morganienne (ancien cours spécialité), une gène héréditaire est une particule portée par un chromosome (le chromosome est considéré comme un groupe de liaison de différents caractères portés par des gènes situés sur ce même chromosome). Chaque gène héréditaire gouverne un caractère qui peut se trouver sous plusieurs formes ou allèles. Les rapports entre les allèles sont récessivité ou dominance ou encore codominance.
Dans la théorie de l'information-programme génétique, qui est celle de tous vos manuels scolaires, on tente d'assimiler le gène moléculaire au gène héréditaire et les allèles aux différentes séquences des gènes. Le gène héréditaire devient virtuel, seul reste le gène moléculaire qui est une séquence d'ADN. Mais on sait maintenant qu'un gène héréditaire peut correspondre à tout un réseau de gènes et qu'un allèle, défini au niveau d'un caractère, est déjà un phénotype, qui doit donc reposer de plusieurs gènes moléculaires ayant chacun plusieurs séquences possibles.
Depuis cette confusion de vocabulaire, on est toujours induit en erreur à chaque fois que l'on utilise le mot de gène et d'allèle dans le sens de la théorie de l'information-programme génétique.
électrophorèse de l'Hb
Plusieurs gènes doivent être activés pour faire une molécule d'Hb.
Chaque gène de l'Hb ne code que pour une chaîne et, s'il est transcrit et traduit, il donne un polypeptide plus ou moins fonctionnel, mais jamais seul. Il faut deux gènes pour donner une Hb fonctionnelle et donc un caractère phénotypique (sauf cas particuliers de quelques molécules d'Hb ayant 4 chaînes identiques). Il est impossible de définir un phénotype qui ait un sens (sauf classificatoire) au niveau de l'expression d'un gène d'une seule chaîne. La molécule d'Hb est gouvernée par 2 gènes pour les globines et un certain nombre de gènes pour ses hèmes. ON NE DEVRAIT PAS PARLER D'UN GÈNE DE L'HB MAIS BIEN D'UN GÈNE D'UNE CHAÎNE DE GLOBINE.

Le niveau de synthèse de chaque gène de globine ne peut être un allèle.
Si l'on veut fusionner les notions héréditaires et moléculaires il est nécessaire de se limiter au phénotype de la molécule complète d'Hb sans entrer dans le détail des gènes moléculaires qui la contrôlent.
On imagine pouvoir définir facilement le phénotype moléculaire d'une cellule en faisant non pas la liste des chaînes, mais celle des molécules d'Hb qu'elle synthétise à un moment donné au cours de sa vie. Attention, il ne s'agit PAS du phénotype cellulaire qui prend en compte toutes les modifications sur la forme ou la physiologie de cette cellule, selon sa composition moléculaire d'Hb. Mais une difficulté insurmontable intervient : tout individu posséde TOUJOURS DEUX exemplaires de chaque groupe de gènes, en provenance de ses parents. Il n'y a pas d'allèles possible au sens de séquence différente donnant un produit différent (voir la variabilité dans le dernier paragraphe). Un allèle sera donc caractérisé par le niveau d'expression de chaque Hb et ce n'est pas la définition d'un allèle au sens moléculaire de séquence d'un gène.
Si l'on souhaitait utiliser le vocabulaire de la génétique mendelienne-morganienne en parlant de dominance, codominance, dominance incomplète, récessivité... on trouverait toujours les mêmes "allèles" chez tous - au polymorphisme près-, mais plus ou moins exprimés. Comment déterminer l'apport de chacun des parents pour en faire une analyse héréditaire ?  Si l'on fait une analyse des Hb présentes dans son sang en prélèvant une petite quantités de sang, on supposera que celui-ci est homogène et représentatif de l'ensemble de l'organisme. Après éclatement des hématies, on sépare les différentes MOLÉCULES par électrophorèse (ce ne sont pas les chaînes mais les molécules qui migrent plus ou moins loin en fonction de leur masse et de leur charge ---> figure ci-contre).
Mais cette technique ne détermine pas quantitativement les différentes Hb. Et pourtant, les allèles ne pourront qu'être définis quantitativement et non pas qualitativement. Je n'ai trouvé aucun document à ce sujet.
Si l'on observe chez un sujet une plus grande quantité d'HbA2 par rapport à d'autres individus, il sera impossible de relier cela à une dominance ou une récessivité. Il y a clairement une impasse dans cette vision de l'hérédité des Hb.

Remarque : si l'on peut dire que, pour une molécule la notion de phénotype moléculaire d'un individu a un certain sens,  celui-ci ne peut que présenter qu'un signal moyenné et partiel. Il est clair que le modèle héréditaire mendélien-morganien n'est pas adapté à une compréhension des interactions entre gènes moléculaires. Les véritables questions - pour lesquelles je n'ai pas de réponse - demeurent : quelles cellules expriment quels gènes à quel niveau d'expression et à quel moment, chez un individu donné ? Quelle est la variabilité de l'expression de ces gènes au niveau des populations ? Y-a-t-il une variabilité liée à des paramètres externes (on dirait "épigénétiques", mais je pense à des paramètres physiologiques ou de résistance individuelle...).

Pour dire les choses clairement d'une autre manière : la variabilité de la synthèse des chaînes de globine n'est pas un caractère héréditaire au sens de Mendel-Morgan.

Remarque : la molécule de myoglobine, qui n'a qu'une sous-unité présente les mêmes difficultés que l'Hb en ce qui concerne l'hérédité. Le gène de la myoglobine (MB - référence MYG_HUMAN, P02144 dans la base Uniprot) est situé sur le chromosome 22 (position q12.3) sur le brin inverse. Chez l'homme il donne lieu à 10 transcrits différents avec 2 ou 3 grands introns conduisant à des protéines entre 74 et 154 aa. C'est un gène extrêmement conservé dans les différentes espèces conduisant à des variants utilisés depuis les tous débuts de l'évolution moléculaire pour crére des arbres phylétiques de ressemblance (voir par exemple le site de l'ac-Nice qui utilise Jalview comme comparateur de séquence et pour construire les arbres phylétiques). Ces arbres phylétiques n'ont strictement rien à voir avec la transmission héréditaire des gènes qui est supposée identique au sein des espèces et avec mutation entre espèces différentes. On ignore encore, comme pour l'Hb, l'équipement génétique des différentes cellules de l'individu et l'utilisation qu'elle fait de ses gènes.

Dans la 4e partie on verra d'autres allèles (formes de l'Hb) correspondant à des associations de chaînes rares conduisant parfois à des maladies que l'on a assimilé à des allèles héréditaires par le même artifice.


2 - De la structure primaire à la forme de la protéine

L'hémoglobine est le type même de protéine complexe avec 4 niveaux de structure (voir page spéciale). Elle est composée de 4 chaînes identiques 2 à 2  (2 chaînes A - malheureusement nommées A et C dans le fichier PDB des molécules -  et 2 chaînes B - malheureusement nommées B et D dans ce même fichier PDB). 
Quelques commandes pour JSmol Eau : visible, cachée

 (couleurs de références page JSmol)
- groupe hème de l'Hb avec un atome de fer qui se lie d'un côté du cycle de l'hème dans lequel il se trouve, à l'aa 87 (His) de la chaîne (extrait) et de l'autre au dioxygène qu'il transporte.
- une seule chaîne de globine A humaine  [menu "chaînes colorées" ou ici];
- deux chaînes de globine A et B  humaines oxygénées associées: une chaîne A (bleue) et une chaîne B (verte) [menu "chaînes colorées" ou ici],  formant ainsi une demie molécule d'hémoglobine humaine oxygénée ;
- la molécule complète d'hémoglobine humaine complète désoxygénée : 2 chaînes de type A (A: bleue et C: rose) et 2 chaînes B  (B: verte et D:jaune)  [menu "chaînes colorées" ou ici].
Remarque: protéine de transport de l'Hb soluble dans le sang : l'haptoglobine (synthétisée par le foie) représentée ici sous forme de 4 molécules d'haptoglobine transportant 4 chaînes A et 4 chaînes B associées en 4 dimères (4f4o.pdb).

Si la structure primaire repose sur la linéarité de la molécule polypeptidique qui est avant tout un copolymère de 20 types d'aa (voir la liaion peptidique sur la page "peptides"), 3 niveaux de structure supplémentaires expliquent la forme de la molécule d'Hb dans l'espace :
- Structure secondaire : on notera que les chaînes sont formées chacune de 7 hélice α pour les chaînes A et de 8 hélices α pour les chaînes B, hélices reliées par des zones plus ou moins déroulées et dessinant des coudes.
- Structure tertiaire : l'hème est lié de façon covalente à un aa de type histidine (His) (aa n°87 de la chaîne) au sein d'une poche hydrophobe. La forme de chaque chaîne est stabilisée par des liaisons faibles (on peut voir en utilisant la chaîne de globine A avec le modèle boules et bâtons qu'il n'y a pas de pont disulfure).2 sous unités répétées
- Structure quaternaire : elle résulte de l'association des 4 chaînes de globine par des liaisons faibles. Les chaînes non homologues sont fortement intriquées et liées alors que les chaînes homologues ont peu de contacts entre elles.
Fichier sur la base européenne EMBL-EBI : (2hhb.pdb); pour l'organisation tétramérique , l'organisation dans l'espace ou topologie est de type 2/2: 2 sous-unitées répétées. Le site http://www.periodicproteincomplexes.org permet de voir qu'il existe 389 protéines de topologie similaire.

3 - De la forme à la fonction : transport des gaz sanguins

HBoxy et désoxy
L'Hb contenue dans les globules rouges est la forme principale de transport du dioxygène (qui s'ajoute au dioxygène dissous dans le plasma). Un gramme d'Hb fixe entre 1,34 et 1,39 mL d'O2 selon les conditions de température, de pH et de pression partielle de dioxygène dans le sang (donc de l'O2 disponible). Une molécule d'Hb peut transporter jusqu'à 4 molécules de dioxygène.
Lors de la fixation du dioxygène au Fe de l'hème la molécule change de forme (image animée ci-contre (MOM PDB) ->).
Ce changement de forme - réversible ou même instable - facilite la fixation du dioxygène sur la forme désoxygénée et la libération du dioxygène à partir de la forme oxygénée. Pour que ce changement de forme soit efficace il est nécessaire qu'il ai lieu à l'endroit précis où chaque phénomène est nnécessaire : prise en charge du dioxygène au niveau des capillaires pulmonaires et rejet du dioxygène au voisinage des cellules qui en demandent.Hb affinité O2
Notre compréhension de la régulation nécessaire à cette délicate physiologie s'est faite en plusieurs étapes :
- Hill avait trouvé dès 1910 que la fixation du dioxygène à l'Hb était un mécanisme de type coopératif (la fixation d'une première molécule d'O2 facilite la fixation de la seconde et ainsi de suite : on a une courbe de fixation sigmoïdale - voir ci-contre <--). Le déclencheur du changement de conformation est donc la teneur en O2 disponible (l'Hb n'est saturée qu'à 64% au niveau des cellules et à 96% au niveau des capillaires pulmonaires).
- dans les années 1950-1960 Perutz (prix Nobel de chimie en 1962 avec John Kendrew) et ses collaborateurs ont étudié toutes les liaisons entre les aa des chaînes de l'Hb dans différents conditions expérimentales à l'aide d'outils comme la diffraction X. Ils ont mis en évidence de façon extrêmement détaillée le changement conformationnel et les interactions entre les chaînes selon la pO2, le pH et la disponibilité d'un élément clef : le 2,3-bisphosphoglycérate (modulateur allostérique se fixant sur la forme désoxygénée).
Dans le modèle actuel représenté sur l'animation ci-dessus, on observe lors de la fixation du dioxygène un mouvement de glissement et de rotation des chaînes entre elles. La conformation T (ou Tense) correspond à la forme désoxygénée et la conformation R (Relax) à la forme oxygénée. Lors de la transition de la configuration désoxygénée vers la configuration oxygénée, le 2,3-DPG est expulsé de la cavité centrale.
On notera que les conditions physiologiques de fonctionnement de la molécule dépendent aussi d'autres facteurs, noatmment la présence de substances susceptibles de modifier le degré d'oxydation du fer.
En effet, le Fe peut fixer le dioxygène s'il est sous la forme Fe2+, mais pas sous la forme oxydée Fe3+, il est donc nécessaire que l'Hb soit protégée contre l'oxydation (la métHb est la forme oxydée inactive).

fixation O2 hèmeLorsque le dioxygène se fixe sur le FeIII, l'atome de Fe est tiré vers la molécule de dioxygène lègèrement au-dessus du plan de l'hème, ce qui fait que l'histidine à laquelle le Fe est lié par covalence en-dessous du plan de l'hème, est à son tour tirée vers le groupe Fe-O2, ce qui provoque le mouvement de rotation de toute la chaîne. Ce changement visible dans l'image ci-dessus , n'est pas accessible dans les fichiers présentés ci-dessous. On se contentera de noter la position du dioxygène par rapport au Fe et à l'histidine n°87 dans la chaîne.
Les deux fenêtres permettent de comparer deux molécules
Fe transportant du dioxygène : hème seul  ou  hème avec l'hélice protéique à laquelle il est lié (HbO8 : hémoglobine oxygénée)

Fe désoxygéné : hème seul ou  hème avec l'hélice protéique à laquelle il est lié (Hb : hémoglobine désoxygénée)

Hème lié au monoxyde carbone (Hb carboxylée : le CO ayant une plus forte affinité pour le Fe3+ que l'O2, se fixe fortement à l'hème et empêche le transport des gaz : c'est un "poison").
Hème lié au monoxyde d'azote (
le monoxyde d'azote (NO) est un neurotransmetteur qui traverse les membranes, il est présent en très petite quantité dans le sang; il peut se fixer à l'hème).


Fe transportant du dioxygène : hème seul  ou  hème avec l'hélice protéique à laquelle il est lié (HbO8 : hémoglobine oxygénée)

Fe désoxygéné : hème seul ou  hème avec l'hélice protéique à laquelle il est lié (Hb : hémoglobine désoxygénée)

Hème lié au monoxyde carbone
(Hb carboxylée : le CO ayant une plus forte affinité pour le Fe3+ que l'O2, se fixe fortement à l'hème et empêche le transport des gaz : c'est un "poison").
Hème lié au monoxyde dazote (le monoxyde d'azote (NO) est un neurotransmetteur qui traverse les membranes, il est présent en très petite quantité dans le sang; il peut se fixer à l'hème).
Remarque : l'Hb transporte aussi 30% du CO2 sanguin sous forme d'hémoglobine carbaminée. Le site de fixation du CO2 n'est pas l'hème. Quelques commandes pour JSmol fenêtre ci-dessus :
Modèles de la molécule
compact
squelette
boules et bâtons
cartoons
Couleurs des atomes :
cpk - a.a. colorés
modèle cartoon : a.a. colorés,
chaînes colorées (couleurs de références page JSmol)
Quelques commandes pour JSmol fenêtre ci-dessus:
Modèles de la molécule
compact
squelette
boules et bâtons
cartoons
Couleurs des atomes :
cpk - a.a. colorés
modèle cartoon : a.a. colorés,
chaînes colorées (couleurs de références page JSmol)



4 - Entre anomalies et variabilité naturelle de l'hémoglobine

On distingue les hémoglobinopathies : anomalies de la séquence de Hb (c'est un polymorphisme (du grec poly=plusieurs et morphos= forme) de séquence), et les thalassémies : anomalies de la synthèse et de l'association des chaînes de globines dans l'Hb (c'est un polymorphisme d'activité synthétique).
drepanocytose

La drépanocytose

Le variant le plus connu de la chaîne B est la chaîne S qui conduit à l'HbS = AASS. À basse pression de dioxygène, cette HbS se polymérise en fibres qui déforment les hématies qui peuvent boucher les capillaires (occlusion) ou qui sont éliminées par le foie et la rate (d'où une anémie - manque de globules rouges). (voir image ci-contre--->)
Cette hémoglobine, lorsqu'elle est synthétisée majoritairement, donne lieu à une maladie : la drépanocytose. Cette maladie est une hémoglobinopathie qui repose EXCLUSIVEMENT sur une mutation NON CORRIGÉE du 6e triplet de bases du gène β (conduisant à une mutation faux-sens au niveau du 6e aa de la chaîne B : Glu->Val).
Du génotype au phénotypeNe pas oublier que pour parler de phénotype, comme en avons discuté ci-dessus, on devrait se placer au niveau de la molécule d'Hb et non des chaînes. Mais, comme on ne possède qu'un gène β, et que tout le monde possède un gène α fonctionnel, à moins d'être gravement malade, on peut relier le phénotype moléculaire HbA/HbS à la forme du gène. Ceci n'est possible que parceque les associations AASB sont impossibles. Ce sont des dimères qui s'assemblent pour former l'Hb. Si une cellule possède un gène βA et un gène βS, elle synthétise les deux types d'Hb.
C'est ainsi que l'on peut appeller allèle la forme du gène. Le caractère (héréditaire) étant le type d'Hb principal et l'allèle (au sens de "forme du caractère héréditaire") pouvant être HbA(AABB) ou HbS(AASS). Il n'en reste pas moins que la variation quantitative de synthèse de chaque reste un caractère non héréditaire qui échappe à la formulation mendélienne stricte.
Un homozygote est un individu qui possède sur ses deux chromosomes 11 la même forme (mutée βS ou non mutée  βA) du gène et un individu  hétérozygote (on parle de "trait drépanocytaire") posséde les deux formes (une sur chacun de ses deux chromosomes 11). Chez les hétérozygotes il y a presque la moitié de chaque type d'Hb qui est synthétisé (55-60% d'HbA,  40-45% d'HbS, et il reste toujours 2-3% d'HbA2: voir ci-dessus chaînesAADD) et l'on parle de codominance. Mais du fait de la grande variabilité individuelle de l'importance des deux types d'Hb chez les hétérozygotes, cette codominance est une notion insuffisante. On tente de chiffrer l'importance de l'allèle morbide (HbS) à l'aide de la notion de pénétrance (plus un allèle est pénétrant, plus il y a d'hétérozygotes malades).  Chez un hétérozygote on trouve les deux formes d'hémoglobines dans toutes les hématies semble-t-il.
Dans certaines populations noires on observe jusqu'à 40% des individus hétérozygotes. En génétique des populations, cette persistance d'une haute fréquence d'hétérozygotie s'explique par un effet sélectif positif des hétérozygotes qui résistent mieux au paludisme que les individus homozygotes sains. La présence d'HbS dans les hématies semblerait empêcher en partie le cycle du parasite (Plasmodium falciparum).
Les hétérozygotes sont rarement malades. Les homozygotes morbides HbS//HbS présentent des formes variables de la maladie (on parle de "syndromes drépanocytaires majeurs" SDM) . Il ne faut oublier que de nombreuses autres hémoglobinopathies peuvent être associées (voir plus bas).
Du point de vue clinique :
+ dès 3 mois et jusqu'à 7 ans on peut observer principalement :
− des crises douloureuses drépanocytaires dues à des occlusions capillaires et des gonflements douloureux des doigts et des pieds ou des douleurs osseuses;
− des anémies aiguës (taux d’hémoglobine < 5 g/dL, le plus souvent 2 à 3 g/dL) nécessitant une transfusion sanguine d’urgence, dues à des crises hémolytiques aiguës (les hématies drépanocytaires sont éliminées par le foie et ou la rate) ;
- des infections : pneumonies (dues au pneumocoque, à Haemophilus influenzae), infections osseuses (dues aux salmonelles ou aux staphylocoques dorés), méningites (dues aux pneumocoques), infections urinaires, septicémies, chocs septiques. C'est une cause précoce de mortalité, souvent même avant qu'un diagnostic de drépanocytose ait été porté. Le risque de mortalité est maximal entre 6 mois et 3 ans.
L'ensemble de ces dysfonctionnements conduit souvent à un retard de croissance ou a des maladies vasculaires cérébrales.
+ après 7 ans : syndromes douloureux occlusifs à répétition,  maladie vasculaire cérébrale et apparition des syndromes thoraciques aigus;
+ à l’âge adulte : les problèmes orthopédiques et ophtalmologiques s'ajoutent.
Une maladie génique
Ainsi l'ensemble des syndromes associés à la drépanocytose peuvent trouver une explication physiologique et cellulaire qui repose sur le niveau moléculaire (la polymérisation de l'HbS). Cet exemple a permis de rapprocher l'hérédité mendelienne-morganienne avec la biologie moléculaire du gène (et la notion d'information-programme génétique). Cependant, comme nous l'avons vu dans la 1e partie ce cas est très particulier : il s'agit d'un exemple ou un gène moléculaire contrôle SEUL la synthèse d'une molécule impliquée SEULE dans une maladie. On parle de maladie génique. Il est à craindre, qu'à part quelques exemples de maladies métaboliques, ces cas restent des exceptions. Si cette notion de maladie génique est assez claire, ses caractéristiques héréditaires restent à discuter.
fibres d'HsS
- chaîne B : chaîne B (globine + hème)
- chaîne S : chaîne S (globine + hème)
- molécule d'HbS (AASS)
- dimère de deux molécules d'HbS ; sous basse pression d'O2 (en conformation relâchée (R = relax)), l'HbS se polymérise et forme des fibres (voir image ci-contre ->) par association de dimères HbS-HbS. deux chaînes S se lient par liaison hydrophobe entre la Val (aa n°6) d'une des chaînes S et une poche hydrophobe de l'autre chaîne S. Chaque Val n°6 de chaque chaîne d'Hb est ainsi capable de se lier à une autre chaîne S. On obttient ainsi des fibres torsadées de dimères HbS-HbA. Ce sont ces fibres qui causent une déformation de l'hématie, une perte de sa souplesse et de sa capacité à se déformer pour passer dans des capillaires étroits, ce qui engendre des thromboses (petits accidents d'obstrcution de capillaires). Lorsque la pO2 augmente, les molécules d'Hb (sous forme T = tense)  ne se polymérisent pas et les fibres peuvent se dépolymériser.
Quelques commandes pour JSmol:
(couleurs de références page JSmol)
Hème
- couleurs des atomes: cpk, rouge
- représentation des atomes: rayon de Van des Waals = 100%, rayon de Van des Waals = 20%, surface de Van des Waals, Van des Waals OFF

- atome de Fe :  gros, petit

Globine
- atmes de la chaîne protéique :
 squelette, boules et bâtons, cartoons, compact
- couleurs des acides aminés :
 gris - a.a. colorés, chaînes colorées, , CPK

- histidines (His) lièes à l'hème
:
His n°92 (liée au Fe par liaison covalente) ON OFF
His n°63 (liée par liaison hydrogène à l'O2 fixé de façon covalente sur le Fe) ON, OFF,
- 6e aa de la chaîne (modifié entre les deux chaînes B et S) :
Val (chaîne S), Glu(chaîne B)

Autres anomalies
Quelques hémoglobinoses humaines de la chaîne A
(sur 189 variants pour A1 et 34 pour A2 connus)
chaîne A
position 1 2 16 30 57 58 68 141
acide aminé Val Leu Lys Glu Gly His AspN Arg
variants HbI

Asp





HbG Honolulu


GluN




Hb Norfolk



Asp



Hb M Boston




Tyr


Hb G Philadelphia





Lys
Quelques hémoglobinoses humaines de la chaîne B
(sur environ 276 variants connus)
chaîne B
position 1 2 3 6 7 26 63 67 125 150
acide aminé Val His Leu Glu Glu Glu His Val Glu His
variants HbS


Val






HbC


Lys






HbG San José



Gly





HbE




Lys




Hb M Saskatoon





Tyr



Hb Zurich





Arg



Hb M Milwaukee-1






Glu


Hb D ß Punjab







GluN

Hémoglobinoses

Plusieurs centaines de variants sont connus pour les deux chaînes de chaque groupe de gènes (⎋OMIM). Certaines anomalies de la chaîne A sont sans aucun symptôme, mais il existe aussi des cas où la fixation du dioxygène est diminuée. Il en est de même pour la chaîne B où un très grand nombre de variants sont sans aucune incidence sur la santé. Devant une telle variation (polymorphisme de séquence) la question légitime qui se pose est de savoir où commence l'anomalie et où se situe la normalité. Comme de grandes études statistiques sont relativement irréalisables au sein de vastes populations (les différentes Hb migrent souvent au même niveau par éléctrophorèse, ce qui oblige à changer de milieu où trouver d'autres méthodes d'analyse plus complexes), ce sont souvent les chaînes européennes et américaines les plus fréquentes qui sont considérées comme "normales".

Thalassémies

Les thalassémies sont des anomalies d'assemblage des chaînes de globine de séquences les plus courantes; on peut aussi les considérer comme des variations du niveau de synthèse des différentes chaînes naturelles chez un individu. Elles ont été découvertes dans les populations du pourtour de la mer Méditerranée (Thalassa en grec) d'où leur nom.