TRADUCTION DE: MICROBIOLOGY 101 INTERNET TEXT

CHAPITRES VIII: ÉLÉMENTS DE GÉNÉTIQUE


Version originale: 11-03-97, traduite le 14-03-97


TABLE DES MATIÈRES

LES DÉBUTS DE LA GÉNÉTIQUE MOLÉCULAIRE

Les débuts de la GÉNÉTIQUE MOLÉCULAIRE remontent aux expériences de FRED GRIFFITH en 1928, où il infectait des souris avec différentes souches d'une bactérie pathogène, Streptococcus pneumoniae. Cette bactérie est létale pour l'homme comme pour la souris et Griffith espérait qu'en étudiant ses effets sur la souris, il pourrait mieux comprendre ses effets sur l'humain. On savait déjà qu'une mutation de la bactérie engendrant la perte de sa capsule lui faisait PERDRE SA VIRULENCE. Donc, si l'on injectait à un premier groupe de souris la bactérie capable de produire sa capsule et à un deuxième groupe celle qui en était incapable, seules les souris du premier groupe mourraient (Fig. 1). Cependant, si les bactéries encapsulées étaient tout d'abord tuées à la chaleur avant d'être injectées, les souris survivaient. Faisant l'hypothèse que malgré tout la capsule était cruciale pour la pathogénicité de la bactérie, Griffith tenta d'injecter un mélange de bactéries encapsulées mortes avec des bactéries non-encapsulées vivantes. Ce mélange tua les souris, ce qui était surprenant puisque l'injection des capsules seules n'avait aucun effet. De plus, lorsque Griffith isola les bactéries de ces souris mortes (respectant ainsi le postulat de Koch) il observa qu'elles s'étaient TRANSFORMÉES en bactéries encapsulées! Trois autres scientifiques (O.T. Avery, C.M. McLeod et M. McCarty) ont entrepris de comprendre le mécanisme de ce "PRINCIPE DE TRANSFORMATION" (PT). Ils vérifièrent que ce n'était pas le matériel capsulaire qui avait tué les souris, mais bien les bactéries vivantes qui avaient retrouvées la capacité de produire une capsule. De plus, leurs études démontrèrent que la nature génétique des bactéries encapsulées retrouvées sur les souris mortes était modifiée; ou encore que les cellules encapsulées mortes originales étaient rescucitées. La reconnaissance de ce principe de transformation, stimula de nouvelles recherches. Au départ, la plupart des scientifiques s'accordèrent à dire que le PT devait se loger au niveau des protéines, puisqu'à l'époque seules les protéines étaient reconnues comme étant assez complexes pour porter de l'information génétique. Après 10 ans de recherche, presque tous les constituants cellulaires ayant été rejetés, il a été établi que seul l'ADN pouvait être le site du PT. Une expérience décisive montra que la transformation ne pouvait pas être empêchée par l'utilisation d'enzymes digérant les protéines (des protéases) mais seulement par une enzyme nouvellement isolée, la DNase, qui dégradait l'ADN. L'annonce faite en 1944 quant à la nature chimique des gènes amorça l'ère de la génétique moléculaire.

Figure 1. Première expérience de transformation.


QU'EST-CE QUE LA GÉNÉTIQUE?

La génétique est l'étude de l'hérédité. Un généticien étudie:

Le fonctionnement des gènes

Le transfert des gènes

La régulation génétique

Les changements ou les mutation génétiques.



 

RÉSUMÉ DE LA CHIMIE DES GÈNES


 

La structure générale des 5 bases, des pentoses et du phosphate dans l'ADN et l'ARN peut être vue sur les sites suivants: Cliquez ici pour voir la structure des bases. Cliquez ici pour voir le pairage des bases AT & GC. Cliquez ici pour accéder à un résumé détaillé de la chimie des acides nucléiques avec beaucoup d'images (programmes utilitaires requis).

L'ADN contient un phosphate, le pentose désoxyribose et les quatres bases: adénine, thymine, guanine et cytosine.

L'ARN contient un phosphate, le pentose ribose et les quatre bases: adénine, uracile, guanine et cytosine.

Dans l'ADN double brins, les nucléotides A-T et G-C sont pairés alors que dans l'ARN double brins les bases A-U et G-C sont pairées. Les paires de bases sont liées par des ponts H, 2 entre A et T ou A et U, et 3 entre G et C. Les 2 brins sont dits COMPLÉMENTAIRES.

L'ADN est ordinairement à double brins, alors que l'ARN est souvent à simple brin mais peut aussi être doubles brins. Pour des images d'ADN, allez à la Librairie RasMol & cherchez la section "DNA double helix".

L'ADN sert toujours de support au code génétique, alors que l'ARN peut avoir d'autres fonctions que celle de transporter de l'information génétique. Cliquez ici pour une comparaison de l'ADN et de l'ARN.

Les chaînes d'ADN et d'ARN sont composées d'une alternance de sucres et de phosphates, avec les bases liées aux sucres. L'image présentée ici montre bien comment les atomes sont liés les uns aux autres dans la molécule d'ADN.

En double brins, la chaîne prend la forme d'une hélice, avec le squelette composé de sucres et de phosphates à l'extérieur et les bases se faisant face au centre. Cette hélice est flexible et peut être comprimée dans un petit espace.

Cliquez ici pour une image de la structure des chromosome et de l'ADN.

Chaque longue chaîne unitaire d'ADN ou d'ARN est appelé un CHROMOSOME et l'ensemble du code génétique d'un organisme est le GÉNOME.

Chaque cellule-fille d'un organisme reçoit une copie complète du génome de la cellule parentale.

Les cellules procaryotes n'ont en général qu'un seul chromosome circulaire, on les dit haploïdes, alors que les eucaryotes en ont plusieurs différents et ont au moins deux copies de chaque chromosomes, ce qui en fait des diploïdes. Un procaryote comme E. coli contient approx. 4700 gènes, mais les cellules eucaryotes peuvent contenir plus de 100,000 gènes. La plus petite bactérie contient ~ 1000 gènes.

Cliquez ici pour une discussion plus approfondie sur la structure et la synthèse des acides nucléiques.
 
 


LA RÉPLICATION DE L'ADN

Bien que la découverte de la structure 3-D de l'ADN en 1953 par Watson et Crick a permis d'expliquer la façon dont les gènes se reproduisent, les détails de ce mécanisme de réplication ne sont toujours pas pleinement compris. Lorsque l'on aborde ce phénomène, les points suivants doivent être considérés:

La réplication de l'ADN procède à un train d'enfer. Par exemple, la réplication du génome de E.coli, d'approx. 5E6 paires de bases prend toujours approximativement 40 min dans les meilleures conditions, ce qui signifie l'addition de deux milles paires de bases à chaque seconde. L'ADN étant composé d'une dizaine de paires de bases par spire, ce processus imprime un mouvement rotatif de 12000 rpm à la molécule d'ADN!

Afin d'éviter la plupart des erreurs, il doit exister des mécanismes de révision et de correction (de réparation) pour s'assurer que la reproduction de la séquence de nucléotides est correcte.

Cependant, les erreurs de réplication, appelées MUTATIONS, sont des événements essentiels au processus d'évolution, de sorte que les mécanismes de correction doivent être efficaces, mais pas trop, pour permettre l'amélioration de l'espèce.
 
 

LES TROIS ÉTAPES PRINCIPALES DE LA RÉPLICATION

1ère étape: La séparation des brins d'ADN afin de permettre à chacun des brins d'être reproduit.

2ème étape: Le pairage correct de nouvelles bases sur les brins existants, afin d'assurer une reproduction fidèle du code génétique..

3ème étape: la création des liens entre les composantes de la nouvelle molécule. Cliquez ici pour une présentation sur la réplication de l'ADN (Voir les figure 1 & 4). Une autre animation ici.

Lors de la première étape, une enzyme, l'ADN POLYMERASE, se lie à un site spécifique d'origine de réplication sur l'ADN, causant la SÉPARATION DES BRINS. Cela permet aux nucléotides (les bases A, T, G, C) de se pairer avec leur base complémentaire sur le vieux brin parental. Lors de la réplication, des HÉLICASES sont responsables du déroulement de l'ADN et défont de petites portions de l'hélice juste devant l'ADN polymérase. Puis, une enzyme, la LIGASE, lie le squelette, la chaîne de molécules désoxyribose-phosphate. L'ADN polymerase a aussi la capacité de réviser la séquence des nucléotides. Si une paire de base incorrecte est trouvée (ex: AG, CT), l'ADN polymérase la remplace avec une paire correcte. Cette mini-description de la transcription est loin d'être complète, plusieurs autres enzymes et protéines étant impliquées dans le processus, mais sera suffisante dans le cadre de ce cours.
 
 



Figure 2. La réplication de l'ADN


LE CODE GÉNÉTIQUE

Les études effectuées vers la fin des années 50 et le début des années 60, permirent d'élucider la relation entre le code génétique et la synthèse des protéines. Il apparut que chaque acide aminé d'une protéine devait être codé par une séquence de trois nucléotides, appelée CODON. De toute évidence, il faut qu'un codon puisse former au moins 20 "mots" génétiques différents pour coder la vingtaine d'acides aminés constituant les protéines. De plus, des mots supplémentaires doivent pouvoir donner des instructions comme "DÉBUT" et "FIN" d'une protéine. Un calcul simple montre que trois nucléotides est le minimum pour accomplir cette tâche: à deux nucléotides, on ne peut former que 4x4 = 16 mots différents, alors qu'à trois nucléotides, on forme 4x4x4 = 64 mots. Une autre pièce vint s'ajouter au casse-tête lorsqu'on repéra la présence d'une forme transitoire d'ARN à forte concentration lors de la synthèse des protéines. On posa alors l'hypothèse que cet ARN servait de messager entre l'ADN et l'appareil de synthèse des protéines, on l'appela donc ARN messager, ou ARNm. Finalement, on remarqua que la synthèse des protéines était toujours associée à une présence en masse des ribosomes, souvent liés à l'ARNm et aux protéines fraîchement produites. Ces résultats permirent d'établir une THÉORIE CENTRALE expliquant le mode de fonctionnement fondamental de tous les organismes vivants. La mise à jour de ces mécanismes de fonctionnement des unités de base de la vie révolutionnèrent notre façon de voir le monde vivant. Pour une illustration de la théorie centrale, cliquez ici.



 
 

CE QUI EST CONNU AU SUJET DU CODE GÉNÉTIQUE:

L'ARNm, une chaîne de nucléotides, simple brin et de courte demie-vie, transporte l'information génétique de l'ADN vers le site de synthèse des protéines.

Le CODON est constitué de 3 bases (nucléotides). Chaque combinaison de 3 bases code pour un acide aminé ou un signal d'arrêt. Sur 64 codons, 61 codons déterminent l'incorporation d'acides aminés (les codons sens), les 3 autres sont impliqués dans la terminaison de la traduction (codons d'arrêt, non-sens ou stop). Le codon ATG sert à la fois à l'incorporation de la méthionine et de codon de départ.

Ce code est UNIVERSEL.

Ce code est dégénérescent, c'est à dire qu'il y a plusieurs codons différents pour un même acide aminé.


Les différentes combinaisons de 3 nucléotides avec les acides aminés correspondants:

                             Deuxième position
       |      U       |      C       |      A       |      G       |
   ----+--------------+--------------+--------------+--------------+----
       | UUU  Phe (F) | UCU  Ser (S) | UAU  Tyr (Y) | UGU  Cys (C) | U  T
     U | UUC   "      | UCC   "      | UAC   "      | UGC   "      | C  r
  P    | UUA  Leu (L) | UCA   "      | UAA  STOP    | UGA  STOP    | A  o
  r    | UUG   "      | UCG   "      | UAG  STOP    | UGG  Trp (W) | G  i
  e  --+--------------+--------------+--------------+--------------+--  s
  m    | CUU  Leu (L) | CCU  Pro (P) | CAU  His (H) | CGU  Arg (R) | U  i
  i  C | CUC   "      | CCC   "      | CAC   "      | CGC   "      | C  è
  è    | CUA   "      | CCA   "      | CAA  Gln (Q) | CGA   "      | A  m
  r    | CUG   "      | CCG   "      | CAG   "      | CGG   "      | G  e
  e  --+--------------+--------------+--------------+--------------+--   
       | AUU  Ile (I) | ACU  Thr (T) | AAU  Asn (N) | AGU  Ser (S) | U  p
  p  A | AUC   "      | ACC   "      | AAC   "      | AGC   "      | C  o
  o    | AUA   "      | ACA   "      | AAA  Lys (K) | AGA  Arg (R) | A  s
  s    | AUG  Met (M) | ACG   "      | AAG   "      | AGG   "      | G  i
  i  --+--------------+--------------+--------------+--------------+--  t
  t    | GUU  Val (V) | GCU  Ala (A) | GAU  Asp (D) | GGU  Gly (G) | U  i
  i  G | GUC   "      | GCC   "      | GAC   "      | GGC   "      | C  o
  o    | GUA   "      | GCA   "      | GAA  Glu (E) | GGA   "      | A  n
  n    | GUG   "      | GCG   "      | GAG   "      | GGG   "      | G
   ----+--------------+--------------+--------------+--------------+----
note: le codon AUG, codant pour la méthionine, sert aussi de codon initiateur (Début) à la synthèse d'une protéine.

LES MUTATIONS

La mutation, ou changement dans la séquences des paires de bases d'un chromosome, n'est pas un phénomène extraordinaire. Bien que la fréquence de mutation soit faible (1E-9 à 1E-10 chez E. coli), le très grand nombre et la rapidité de la reproduction des cellules font en sorte que les mutations se produisent souvent. Nous-même, comme tous les organismes vivants, sommes le fruit d'une multitude de mutations. Les mutations sont la force motrice de l'évolution, basée sur la plus grande variété possible. Les mutations ont les caractéristiques suivantes:

Elles sont le résultat d'un changement dans la séquence des paires de bases d'un génome d'ADN ou un brin d'ARN.

La plupart des mutations ont un effet NÉFASTE, quelques unes n'ont pas d'effet, et une infime proportion ont un effet BÉNÉFIQUE.
 

La plupart des mutations ont un effet néfaste parce qu'elles modifient le code génétique, ce qui à son tour AFFECTE LA STRUCTURE PRIMAIRE D'UNE PROTÉINE, et a pour effet de changer la capacité de cette protéine à faire ce à quoi elle était destinée à l'origine.

Les mutations se produisent généralement AU HASARD. Le taux de mutation peut cependant être augmenté par des AGENTS MUTAGÈNES, tels les rayons UV et X, les radiations atomiques et des agents chimiques tels le benzène, etc.. Cependant, avec les techniques actuelles de biologie moléculaire, il est possible d'imposer une MUTATION DIRIGÉE, c'est à dire changer une paire de base particulière, afin de modifier un acide aminé particulier sur une protéine et observer l'effet que cela aura sur la fonction de cette protéine.

Une mutation peut affecter une seule paire de base ou un fragment important d'un chromosome, portant sur plusieurs gènes. Par exemple, pour une séquence de base initiale AATGGCAAT tous les changements suivants (indiqués en rouge) sont des mutations:

AATGCCAAT; AAAACGGTT; AATGAGCAAT; AATG.CAAT; AA.....AT (les "points" indiquent la perte de bases)

Une modification qui fait en sorte qu'un codon est remplacé par un autre codon qui code pour le MÊME acide aminé (DÉGÉNÉRESCENCE) est aussi une mutation silencieuse, même si elle n'a aucun effet apparent. Une mutation qui change un acide aminé pour un autre acide aminé très semblable mutation faux-sens peut ne pas avoir d'effet significatif sur la fonctionnalité d'une protéine et donc être neutre, mais peut aussi changer la chimie de la protéine et avoir un effet.

Les différents types de mutations sont listés ci-dessous:

Forme sauvage du gène = la séquence de paires de bases originale.

Directe = passage de la forme sauvage vers une forme mutante.

Réverse = inverse de la mutation directe, qui entraîne un retour vers le phénotype sauvage.

Ponctuelle = n'affecte qu'une paire de base.

Non-sens = conversion d'un codon sens en non-sens ou arrêt.

Déletion = l'élimination d'une ou plusieurs paire de base.

Décalage du cadre de lecture (frameshift) = l'insertion ou la déletion de une ou deux paires de bases, entraînant un changement de cadre de lecture pour tous les codons en aval.
 
 




 

Figure 3. Fixation d'une mutation dans l'ADN. À gauche, l'ADN se réplique, cependant une erreur s'est produite (cercle jaune) et T s'est pairé avec G (brin bleu). Si cette erreur n'est pas corrigé avant la prochaine ronde de réplication, lorsque le brin contenant la paire G-T sera copiée, un des brins (image du milieu, à gauche) contiendra la sequence TGT originale et une nouvelle séquence ACA en sera tirée (bleu). Cependant, le brin de droite, qui contient la séquence incorrecte ATA sera copiée dans un nouveau brin TAT (rouge). Si la MATRICE ou BRIN INSTRUCTEUR dans cet ADN est le brin de droite dans chaque molécule d'ADN, alors l'ARNm serait copié à partir de ACA dans le brin correct pour donner un codon ARNm avec UGU pour l'acide aminé CYSTÉINE. Cependant, la MATRICE de l'ADN mutant donne un ARN mutant avec un codon UAU donnant l'acide aminé TYROSINE. Après la deuxième ronde de réplication, l'ERREUR (MUTATION) est "FIXÉE" dans chaque brin de la cellule qui contient cet ADN


LES ALLÈLES: DES VARIANTS GÉNÉTIQUES

Lorsqu'un gène sauvage mute, il forme une ALLÈLE ou ALTERNATIVE de ce gène. Puisque le nombre de mutations potentielles est MINIMALEMENT équivalent au nombre de paire de base dans un gène, plusieurs allèles sont possibles. La plupart des mutations résulte en un gène produisant une protéine inactive, mais dans certains cas, l'activité est améliorée ou n'est plus sujette à la régulation originale (plus de régulation, ou régulation par une molécule allostérique différente). Dans des cas très rares, l'allèle aura une activité catalytique différente, par exemple en étant moins sélective.



 
 

LA TRANSCRIPTION ET LA TRADUCTION.

Figure 5. Processus de transcription.


 Le processus de synthèse d'une protéine est divisé en deux étapes. La première étape est la TRANSCRIPTION. Lors de ce processus, les instructions encodées dans l'ADN sont transférées dans l'ARN. Les raisons de la nécessité de cette étape ne sont pas clairement établies. Ça peut être parce que l'ARN est une molécule plus ancienne que l'ADN ou peut-être parce que si l'ADN était utilisée pour cette étape, il y aurait trop d'ADN dans la même cellule, rendant l'organisation difficile. Peu importe, l'ADN est copiée dans l'ARNm. Ce processus est mené par une enzyme, l'ARN POLYMÉRASE. Les étapes en sont:

L'ARN polymérase se positionne sur un site d'initiation, un PROMOTEUR. Chaque gène ou groupe de gène a un promoteur. En fait, un SITE ACTIF sur l'ARN polymérase reconnaît la séquence du promoteur sur l'ADN comme le site de son substrat.

Une fois sur le promoteur, l'ARN polymérase ouvre l'ADN de façon à pouvoir en copier un brin. Seul le brin instructeur ou matrice est copié. La séquence correspondant à un gène est situé sur seulement un des deux brins complémentaires, mais différents gènes peuvent être encodés sur des brins opposés.

Comme on peut le voir sur la Figure 5, l'ARN polymérase descend le long de l'ADN et synthétise une copie COMPLÉMENTAIRE d'ARN à partir de la matrice.

La reproduction se poursuit jusqu'au SIGNAL D'ARRÊT, où l'ARNm se détache du complexe ADN/ARN polymérase. L'ARNm peut maintenant être utilisée comme une matrice par laquelle des protéines seront produites. Ce processus de production de protéines à partir de l'ARNm est la TRADUCTION, dont voici les grandes lignes.
 
 


Figure 6. Traduction.


 




Il y a plusieurs composants impliqués dans la TRADUCTION. Les RIBOSOMES sont des usines productrices de protéines. Le ribosome est composé de deux sous-unités qui sont elles composées ~40 protéines et plusieurs petites molécules d'ARN. Les deux sous-unités se joignent seulement autour de l'ARNm, sinon elles nagent séparément dans le cytoplasme.
 
 


Figure 7. La structure d'un ribosome. Les autres composants sont les 20 acides aminés et une molécule appelé l'ARN de transfert ou ARNt. Le processus complet consomme beaucoup d'ATP. L'ARNm des procaryotes ne dure par longtemps étant donné que la vie des procaryotes est si courte, leur environnement peut changer rapidement et nécessiter l'arrêt d'une synthèse particulière. Il exise un ARNt unique pour chaque codon et CHAQUE ACIDE AMINÉ parce que l'ARNt doit amener le bon acide aminé au bon codon sur l'ARNm. La région sur l'ARNt qui se lie à l'ARNm est appelé l'ANTICODON.

Figure 8. L'ARNt. Chaque ARNt porte un acide aminé particulier à un bout qui "matche" avec l'anticodon à l'autre extrémité. L'anticodon est complémentaire au codon sur l'ARNm.

Figure 9. ARN polymérase se déplaçant le long de 3 gènes structuraux et transcriptant l'ARNm (mauve). Les ribosomes se lient aux ARNm et les traduisent en protéines (orange, vert et noir)


 Les étapes de la traduction sont:

Les deux composantes du ribosome se lient à l'ARNm au CODON DE DÉPART (ATG, méthionine).

Puis le premier complexe ARNt-acide aminé se lie au CODON suivant le codon de départ.
 
 



 


L'ARNm se déplace d'un codon sur le ribosome.

L'ARNt suivant, avec son acide aminé, se lie au codon libre suivant sur l'ARNm, amenant 2 acides aminés ensemble de façon à ce qu'une enzyme puisse former un lien PEPTIDIQUE entre les deux acides aminés adjacents.

L'ARNm se déplace de nouveau d'un autre codon et le premier ARNt vide est relâché.

etc.

Le processus continu tout le long de l'ARNm, la protéine grossissant au fur et à mesure, jusqu'au codon d'arrêt. Le ribosome est alors libéré et se re-sépare en sous-unités, à la recherche d'un autre codon de départ. En fait, les ribosomes font la queue devant les codons de départ et processent les protéines à la queuleuleu sur l'ARNm.

Un excellent site sur divers processus de la vie se trouve ici.



 
 

LA RÉGULATION DES GÈNES ET LE CONTRÔLE DE LA SYNTHÈSE

INTRODUCTION

La régulation des gènes est un élément essentiel pour le bon fonctionnement de tout organisme vivant. Par exemple, E. coli contient ~4700 gènes, mais seulement ~1000 enzymes sont requis dans le cytoplasme à un temps donné. D'autre part, chaque cellule de notre corps contiennent tous nos gènes (~100,000) mais n'en ont besoin que d'une partie dépendamment de leur localisation et de leur condition à un temps donné. Il apparaît évident que la régulation des gènes prendra une importance toute particulière pour les organismes pluricellulaires: personne n'aimerait voir un bras lui pousser dans le front, par exemple. On peut aussi penser à des exemples plus dramatiques, comme les difformités congénitales, le développement du cancer, etc. Les cellules d'organismes pluricellulaires doivent donc développer des moyens sophistiqués pour savoir et quand elles doivent exprimer tel ou tel gènes. Bien que le niveau de régulation requis soit moins élevé, cela est aussi vrai pour les organismes unicellulaires. Des "sens" doivent permettre de sonder les conditions environnementales et des mécanismes de régulation doivent contrôler l'expression des gènes en conséquence. D'ailleurs les premières études sur la régulation génétique ont été faites sur des procaryotes. La compréhension des ces mécanismes simples permettant de mieux comprendre par la suite des schémas de contrôle plus complexes.
 

LE SUCCESS STORY DE E. COLI, OU LA BACTÉRIE QUI EST PASSÉE DE L'ÉGOÛT AU NOBEL



VERS LE CHAPITRE 9


Copyright © Dr. R. E. Hurlbert, 1997. This material may be used for educational purposes only and may not be duplicated for commercial purposes.

Copyright © A. Garnier, 1997 pour la version française modifiée (avec la permission de l'auteur). Ce matériel peut être utilisé à des fins pédagogiques. Aucun droit de reproduction pour des fins commerciales.