Bookshelf
C’est seulement lorsque la structure de l’ADN a été découverte au début des années 1950 qu’il est devenu clair comment l’information héréditaire dans les cellules est codée dans la séquence de nucléotides de l’ADN. Les progrès réalisés depuis lors ont été stupéfiants. Cinquante ans plus tard, nous disposons de séquences complètes du génome de nombreux organismes, dont l’homme, et nous connaissons donc la quantité maximale d’informations nécessaires pour produire un organisme complexe comme nous. Les limites de l’information héréditaire nécessaire à la vie contraignent les caractéristiques biochimiques et structurelles des cellules et montrent clairement que la biologie n’est pas infiniment complexe.
Dans ce chapitre, nous expliquons comment les cellules décodent et utilisent l’information contenue dans leur génome. Nous verrons que nous avons beaucoup appris sur la façon dont les instructions génétiques écrites dans un alphabet de seulement quatre « lettres » – les quatre nucléotides différents de l’ADN – dirigent la formation d’une bactérie, d’une drosophile ou d’un humain. Néanmoins, nous avons encore beaucoup à découvrir sur la façon dont les informations stockées dans le génome d’un organisme produisent même la plus simple des bactéries unicellulaires avec 500 gènes, sans parler de la façon dont elles dirigent le développement d’un être humain avec environ 30 000 gènes. Une énorme quantité d’ignorance subsiste ; de nombreux défis fascinants attendent donc la prochaine génération de biologistes cellulaires.
Les problèmes auxquels les cellules sont confrontées pour décoder les génomes peuvent être appréciés en considérant une petite partie du génome de la mouche des fruits Drosophila melanogaster (figure 6-1). La plupart des informations codées par l’ADN présentes dans ce génome et dans d’autres sont utilisées pour spécifier l’ordre linéaire – la séquence – des acides aminés pour chaque protéine fabriquée par l’organisme. Comme décrit au chapitre 3, la séquence d’acides aminés dicte à son tour la façon dont chaque protéine se plie pour donner une molécule ayant une forme et une chimie distinctes. Lorsqu’une protéine particulière est fabriquée par la cellule, la région correspondante du génome doit donc être décodée avec précision. Des informations supplémentaires codées dans l’ADN du génome précisent exactement à quel moment de la vie d’un organisme et dans quels types de cellules chaque gène doit être exprimé en protéine. Les protéines étant les principaux constituants des cellules, le décodage du génome détermine non seulement la taille, la forme, les propriétés biochimiques et le comportement des cellules, mais aussi les caractéristiques distinctives de chaque espèce sur Terre.
Figure 6-1
Représentation schématique d’une partie du chromosome 2 du génome de la mouche des fruits Drosophila melanogaster. . Cette figure représente environ 3% du génome total de la drosophile, disposé en six segments contigus. Comme le résume la clé, la symbolique (suite…)
On aurait pu prédire que les informations présentes dans les génomes seraient disposées de manière ordonnée, ressemblant à un dictionnaire ou à un annuaire téléphonique. Bien que les génomes de certaines bactéries semblent assez bien organisés, les génomes de la plupart des organismes multicellulaires, comme notre exemple de la drosophile, sont étonnamment désordonnés. De petits morceaux d’ADN codant (c’est-à-dire l’ADN qui code pour les protéines) sont entrecoupés de grands blocs d’ADN apparemment sans signification. Certaines sections du génome contiennent de nombreux gènes et d’autres en sont totalement dépourvues. Les gènes des protéines qui fonctionnent étroitement les unes avec les autres dans la cellule sont souvent situés sur des chromosomes différents, et les gènes adjacents codent généralement des protéines qui n’ont pas grand-chose à voir les unes avec les autres dans la cellule. Le décodage des génomes n’est donc pas une mince affaire. Même avec l’aide de puissants ordinateurs, il est encore difficile pour les chercheurs de localiser définitivement le début et la fin des gènes dans les séquences d’ADN de génomes complexes, et encore moins de prédire quand chaque gène est exprimé dans la vie de l’organisme. Bien que la séquence d’ADN du génome humain soit connue, il faudra probablement au moins une décennie pour identifier chaque gène et déterminer la séquence précise d’acides aminés de la protéine qu’il produit. Pourtant, les cellules de notre corps font cela des milliers de fois par seconde.
L’ADN des génomes ne dirige pas lui-même la synthèse des protéines, mais utilise l’ARN comme molécule intermédiaire. Lorsque la cellule a besoin d’une protéine particulière, la séquence de nucléotides de la portion appropriée de l’immensément longue molécule d’ADN dans un chromosome est d’abord copiée en ARN (un processus appelé transcription). Ce sont ces copies ARN de segments de l’ADN qui sont utilisées directement comme modèles pour diriger la synthèse de la protéine (un processus appelé traduction). Le flux de l’information génétique dans les cellules va donc de l’ADN à l’ARN puis à la protéine (figure 6-2). Toutes les cellules, de la bactérie à l’homme, expriment leur information génétique de cette façon – un principe si fondamental qu’il est appelé le dogme central de la biologie moléculaire.
Figure 6-2
Le cheminement de l’ADN à la protéine. Le flux de l’information génétique de l’ADN à l’ARN (transcription) et de l’ARN à la protéine (traduction) se produit dans toutes les cellules vivantes.
Malgré l’universalité du dogme central, il existe des variations importantes dans la façon dont l’information circule de l’ADN à la protéine. La principale d’entre elles est que les transcriptions d’ARN dans les cellules eucaryotes sont soumises à une série d’étapes de traitement dans le noyau, y compris l’épissage de l’ARN, avant d’être autorisées à sortir du noyau et à être traduites en protéines. Ces étapes de traitement peuvent modifier de façon critique la « signification » d’une molécule d’ARN et sont donc cruciales pour comprendre comment les cellules eucaryotes lisent le génome. Enfin, bien que nous nous concentrions dans ce chapitre sur la production des protéines codées par le génome, nous constatons que pour certains gènes, l’ARN est le produit final. Comme les protéines, beaucoup de ces ARN se replient en structures tridimensionnelles précises qui ont des rôles structurels et catalytiques dans la cellule.
Nous commençons ce chapitre par la première étape du décodage d’un génome : le processus de transcription par lequel une molécule d’ARN est produite à partir de l’ADN d’un gène. Nous suivons ensuite le destin de cette molécule d’ARN à travers la cellule, pour terminer lorsqu’une molécule de protéine correctement repliée a été formée. À la fin du chapitre, nous examinons comment le schéma actuel, assez complexe, de stockage, de transcription et de traduction de l’information a pu naître de systèmes plus simples dans les premiers stades de l’évolution cellulaire.