Mécanisme dynamique pour l’appareil de transcription orchestrant des réponses fiables aux activateurs
Caractérisation mathématique de la dynamique du TA
La dynamique du TA est dictée par la façon dont ses composants sont organisés spatialement et temporellement sur le promoteur. Comme le TA peut prendre de nombreux états de configuration distincts et que l’évolution de l’état est essentiellement stochastique, impliquant de nombreuses molécules et des interactions complexes, nous employons les théories des statistiques et des probabilités pour étudier la dynamique du TA. Pour simplifier, nous supposons que les concentrations des espèces associées à la transcription, telles que les GTF, restent constantes autour du gène modèle et que les interactions moléculaires impliquant le promoteur sont en équilibre dynamique. Le terme » équilibre dynamique » ne signifie pas que les interactions moléculaires sont toutes réversibles ; il signifie simplement que l’AT doit retrouver son état actuel après un certain temps. Un gène modèle et toutes les espèces qui l’entourent constituent un système. Les hypothèses ci-dessus impliquent qu’un tel système est dans un état stable. Considérons un ensemble statistique constitué d’un grand nombre de ces systèmes essentiellement identiques, chacun évoluant indépendamment. Le nombre de systèmes est suffisamment grand pour que tous les états de configuration possibles de l’AT puissent être couverts par cet ensemble. Autrement dit, chaque état subi par un gène individuel met en correspondance les états des autres gènes de l’ensemble et la proportion de gènes dans un état particulier X (par exemple, les gènes dont les exhausteurs sont liés par des activateurs), P(X), reste constante dans le temps. De manière équivalente, si un gène individuel est observé à tout moment, la probabilité que le gène soit dans l’état X est également P(X). En ce sens, l’état dans lequel se trouve un gène individuel est un événement aléatoire.
Pour le modèle minimal (Fig. 1a), nous définissons tous les états de configuration de l’AT comme un ensemble universel Ω et les différents états ayant les mêmes caractéristiques clés comme les sous-ensembles suivants, respectivement (Fig. 1b). A indique que l’enhancer est lié à un activateur. S indique que le promoteur central est lié par les protéines du SCF. M indique qu’un ARNm naissant est en gestation (y compris le processus allant de la formation du PIC à l’échappement de la Pol II dans l’élongation). J indique que l’activateur lié à l’enhancer est conjecturé au SCF, PIC ou OPC par l’intermédiaire du Mediator. Comme l’initiation de la transcription chez les eucaryotes nécessite la présence du SCF sur le promoteur central4,12, M⊂S. Selon les définitions, J⊂AS. Dans l’ensemble MJ, M et A sont concomitants, c’est-à-dire que les activateurs liés à l’enhancer peuvent affecter directement l’action de Pol II par l’intermédiaire du Mediator. Ainsi, l’initiation transcriptionnelle sous régulation directe des activateurs est décrite par l’ensemble MJ, tandis que l’initiation transcriptionnelle basale, indépendante de l’activateur, est incluse dans l’ensemble M-J. La probabilité d’un ARNm naissant en gestation, c’est-à-dire la probabilité qu’un ARNm soit généré, est
où q est une constante représentant l’initiation transcriptionnelle basale et Aj est un sous-ensemble de A (voir S1 des informations supplémentaires pour plus de détails). Dans Aj, les activateurs liés à l’enhancer sont obligés d’entrer en contact avec le médiateur lié à SCF, PIC ou OPC. L’équation (1) caractérise la relation entre la production d’ARNm et les propriétés dynamiques du TA.
Encodant la concentration des activateurs transcriptionnels
Suivant des architectures distinctes de la chromatine du promoteur dans différentes étapes transcriptionnelles, les activateurs liés à l’enhancer peuvent remplir diverses fonctions, telles que la promotion de l’acétylation des histones et le recrutement des GTF4,5,15. Plus précisément, l’ensemble Aj implique les activateurs liés aux amplificateurs qui sont responsables de la manipulation de la machinerie transcriptionnelle de base et du contrôle de l’initiation de la transcription. De plus, les activités de ces activateurs sont également associées au codage de la concentration nucléaire des activateurs, car est le seul facteur de l’équation (1) qui dépend de la concentration des activateurs. Ici, nous étudions la dynamique de ces activateurs.
Les activateurs se déplacent rapidement dans le noyau et la probabilité qu’ils atteignent l’enhancer est proportionnelle à leur abondance nucléaire9. Considérons une période de temps, pendant laquelle les activateurs impliqués dans l’ensemble Aj se lient à l’enhancer puis s’en éloignent pendant m (m = 1, 2, 3, …) cycles. Nous définissons le taux d’occupation temporelle RTOR de ces activateurs comme , où et désignent le temps de liaison et de déliaison du j-ème cycle, respectivement. Pour le nombre fixe na d’activateurs dans le noyau, nous avons
où aon et aoff sont les fonctions de propension de liaison et de déliaison, respectivement (voir S2 des informations supplémentaires pour plus de détails). aon est une fonction de na, tandis que aoff est indépendant de na. L’équation (2) indique qu’au fur et à mesure que m augmente, converge vers une valeur déterministe, qui est une fonction monotone croissante de na (Fig. 1c-d et Fig. S1 ; il s’agit d’une propriété générale qui peut être appliquée aux cas où le nombre de sites de liaison apparentés sur l’amplificateur est supérieur à un (voir équations S13-S18)). Cette convergence implique que même la concentration variable dans le temps des activateurs peut être codée par RTOR, à condition que les activateurs soient activés et désactivés assez fréquemment sur une fenêtre de temps avec leur concentration presque inchangée. En effet, il existe des mécanismes de dissociation actifs qui garantissent le cycle rapide des activateurs9,19,20,21,22. Le temps de liaison a été estimé comme étant de l’ordre de quelques secondes à quelques dizaines de secondes9,10. De plus, il a été prouvé sur le gène endogène CUP1 que ce cycle rapide est fonctionnel10. On peut supposer que le RTOR code la concentration des activateurs transcriptionnels. D’autre part, pendant la période où les activateurs activent et désactivent l’enhancer pendant m fois, la probabilité que l’enhancer soit trouvé lié par un tel activateur est . Parce que la moyenne de sur l’ensemble est aussi f(na), on a
Les conditions de contrainte assurant des réponses transcriptionnelles fiables
Compte tenu de la stochasticité de l’occurrence des événements transcriptionnels, pour obtenir une réponse transcriptionnelle fiable, il faut que le code RTOR, qui représente en temps voulu la concentration des activateurs, soit transduit avec une grande fidélité en quantité de transcrits. Idéalement, si P(S), et étaient tous égaux à 1, la transduction exacte de l’information serait accomplie. Dans ce qui suit, nous présentons les conditions dans lesquelles ces trois facteurs peuvent être suffisamment grands pour assurer des réponses transcriptionnelles fiables en présence de fluctuations aléatoires (les figures S2 et S3 fournissent des explications intuitives pour cette sous-section).
L’équation (3) implique que la concentration des activateurs ne peut pas être suffisamment encodée sans la persistance du SCF sur le promoteur. Ainsi, le SCF devrait s’assembler rapidement lorsque l’architecture de la chromatine le permet et être beaucoup plus stable que les activateurs liés à l’enhancer (condition I). Une telle stabilité du SCF a été observée expérimentalement et le temps de liaison de TBP (TATA-binding protein, le composant central du SCF) sur le promoteur peut atteindre 20 minutes dans les cellules humaines11. Pour , Aj est une condition préalable à l’apparition de J. Comme le RTOR est déterminé par les courts temps de liaison individuels des activateurs, J devrait se produire immédiatement après l’apparition de Aj (Fig. S3). Sinon, l’information sur le RTOR est largement perdue ou même faussement utilisée pour diriger l’initiation transcriptionnelle (notez que J est une condition préalable à M). Par conséquent, pour transférer correctement le code RTOR, le médiateur doit agir en attendant de se lier aux activateurs du cycle et transmettre l’information par allostérie23,24,25 (condition II). En effet, d’autres types d’interactions moléculaires, comme les collisions libres, ne peuvent pas transmettre précisément l’information sur le temps de liaison des activateurs. Un tel allostérie du Mediator est soutenu par les travaux précédents26. détermine comment l’information sur RTOR héritée par J est convertie pour guider la quantité de transcrits. Puisque RTOR dépend de la liaison intermittente des activateurs, une grande exige que pendant les courtes périodes de liaison, les transcriptions soient produites à un taux plutôt rapide (Fig. S2) (Condition III). Cette caractéristique est également vérifiée par les estimations computationnelles des données expérimentales (voir S3 des informations supplémentaires). Par conséquent, les trois conditions peuvent être satisfaites naturellement.
Le mécanisme dynamique de la transcription régulée par les activateurs
Les trois conditions de contrainte ci-dessus déterminent ensemble le fonctionnement de l’AT. Il se produit de manière répétitive un état dans lequel un espace de type pince relativement stable est formé entre le médiateur et l’enhancer (Fig. 2 ; selon les conditions I et II). Comme il a été démontré expérimentalement que le SCF n’est pas très stable11, cet espace est construit temporairement. L’espace en forme de pince attire les activateurs libres puis les décolle rapidement, le RTOR étant déterminé par la concentration des activateurs (selon les équations (2-3)). Dès qu’une molécule d’activateur pénètre dans cet espace, il se produit une allostérie dans le Mediator, ce qui facilite l’exécution des fonctions des GTF et d’autres protéines connexes. Par conséquent, les Pol II peuvent initier/réinitier la transcription très rapidement (selon les conditions II et III), le RTOR régissant la quantité de transcrits.
Ce mécanisme suggère que les interactions moléculaires impliquant le promoteur obéissent à des principes dynamiques élégants comme suit. Alors que l’espace de type pince est temporairement formé, il est beaucoup plus stable que les activateurs qui y sont installés. Les activateurs peuvent entrer et sortir de l’espace de nombreuses fois, même pendant de courts épisodes où leur concentration reste pratiquement inchangée ; ainsi, la concentration des activateurs peut être représentée par le RTOR en temps opportun. Étant donné que le médiateur transmet l’information par allostérie et que le taux de réinitialisation transcriptionnelle est beaucoup plus important que le taux de cyclage des activateurs, le code RTOR est efficacement utilisé pour diriger la synthèse de l’ARNm. En un mot, l’espace de type pince est la base structurelle de réponses transcriptionnelles fiables. Au lieu d’être un obstacle, la nature stochastique des interactions moléculaires est pleinement utilisée pour induire la transcription de manière fiable ; cela dépend largement des différents degrés de stabilité des composants de l’AT, qui s’étendent sur plusieurs ordres de grandeur. Les arguments ci-dessus sont étayés par des données expérimentales et les échelles de temps typiques sont les suivantes : la demi-vie de l’espace de type pince est d’environ 5 min11, le temps d’occupation des activateurs dans l’espace est de l’ordre de quelques secondes à quelques dizaines de secondes10, l’allostérie se produit généralement dans le temps de quelques millisecondes à pas plus d’une seconde23,24,25 et il suffit de plusieurs secondes pour réinitialiser une transcription (voir S3 des informations supplémentaires).
Validation du mécanisme par des simulations numériques
Pour vérifier davantage le mécanisme dynamique proposé, nous construisons un modèle stochastique simplifié de la transcription des gènes avec des paramètres physiologiquement réalistes (voir la figure S4 et S4 des informations supplémentaires pour plus de détails). Ce modèle décrit les principales transitions d’état de l’AT et décrit également simplement la dynamique de la chromatine associée, ce qui permet de caractériser la réponse transcriptionnelle aux activateurs transcriptionnels. Dans ce qui suit, l' »entrée » et la « sortie » désignent la concentration nucléaire des activateurs et la quantité de produits génétiques, ARNm ou protéines, respectivement.
Premièrement, nous explorons l’évolution temporelle du nombre d’ARNm cellulaires à des niveaux d’entrée constants (Fig. 3a). Notamment, les ARNm sont produits en rafale, conformément à l’opinion dominante14,27,28,29,30,31,32. Pour les entrées de faible niveau, un allèle est transcrit tandis que l’autre est silencieux dans une cellule diploïde et donc le phénomène de rafale est apparent. Pour les entrées de haut niveau, cependant, les deux allèles éclatent fréquemment de sorte que la somme devient presque constante. Cela suggère que le phénotype de réponses transcriptionnelles élevées persistantes peut être observé à des niveaux d’entrée élevés14.
Une analyse expérimentale récente a écarté la possibilité que l’environnement chromatinien joue un rôle central dans le façonnement du bursting transcriptionnel32. Ici, nous démontrons qu’une rafale de transcriptions provient d’une réinitiation persistante par les Pol II lorsque l’espace de type pince est occupé par les activateurs (Fig. 4). En d’autres termes, l’initiation de l’ARNm est elle-même en rafale. La rafale n’est pas un simple bruit ; au contraire, c’est une manifestation directe du code RTOR, qui représente la concentration des activateurs et guide la production d’ARNm.
Deuxièmement, nous étudions la relation moyenne entrée/sortie de la réponse transcriptionnelle. La sortie moyenne ressemble à une fonction de Hill de l’entrée, qui est largement utilisée en biologie des systèmes pour modéliser l’expression des gènes3,33,34 (figure 3b). La courbe de l’écart-type SDout de la sortie par rapport à l’entrée est approximativement en forme de cloche (Fig. 3c). L’intensité du bruit intrinsèque, définie comme le rapport de SDout à la sortie moyenne35, est inversement corrélée à l’entrée (l’encart de la Fig. 3b). De plus, les caractéristiques ci-dessus sont insensibles aux légères fluctuations de l’entrée (c’est-à-dire le bruit extrinsèque) (Fig. S5), ce qui suggère la robustesse de la réponse transcriptionnelle au bruit. Tous ces résultats sont en bon accord avec les mesures expérimentales effectuées à la fois chez Saccharomyces cerevisiae36 et chez les embryons de drosophile37. En particulier, le côté gauche de la courbe SDout est plus bas que son côté droit ; cette caractéristique est presque quantitativement en accord avec les données expérimentales37 (voir S5 des informations supplémentaires pour de plus amples discussions). En revanche, les déviations des principes dynamiques proposés ci-dessus (y compris les circonstances dans lesquelles le cycle des activateurs est lent, le complexe d’échafaudage/espace de type clamp n’est pas stable, ou/et le taux de réinitialisation transcriptionnelle est faible) réduiraient la capacité de l’AT à répondre de manière fiable à l’entrée (Fig. S6).
La relation entrée/sortie observée dans les embryons de drosophile était censée être réalisée en utilisant au maximum la limite des interactions moléculaires37,38,39. Les propriétés de ces interactions microscopiques sont intégrées pour être manifestées macroscopiquement comme SDout. La courbe SDout est encore globalement en forme de cloche par rapport à la courbe SDin (cf. Fig. 1d). C’est-à-dire que la signature du code RTOR peut être directement transmise à la sortie. Cela confirme que le taux d’occupation temporel des activateurs est réellement exploité pour réguler la transcription et que le Médiateur transmet l’information par allostérie. D’autre part, la courbe SDout est asymétrique, le côté droit étant plus élevé que le gauche. La raison en est évidente. Lorsque l’entrée est très élevée, l’enhancer est lié par les activateurs presque tout le temps et donc les fluctuations reflètent principalement les propriétés dynamiques du SCF et la réinitiation transcriptionnelle par les Pol II. Nos simulations supplémentaires montrent que le côté droit de la courbe SDout diminue lorsque la stabilité du SCF ou le taux de réinitialisation transcriptionnelle augmente ; ce n’est qu’en augmentant leur force au-delà des plages physiologiques que la courbe devient symétrique (Fig. S6F). Cela vérifie également que P(S) et sont effectivement suffisamment grands. Par conséquent, les propriétés de SDout devraient prouver de manière concluante le mécanisme transcriptionnel microscopique.
Troisièmement, nous sondons la distribution des niveaux d’ARNm à travers une grande population de cellules exposées à la même entrée (Fig. 3d). Pour les petites entrées, le phénomène d’éclatement est particulièrement évident et la plupart des cellules n’ont pas ou peu d’ARNm. Ceci est cohérent avec l’observation expérimentale27,30,31. Mais la distribution devient progressivement normale lorsque l’entrée augmente. Pour aon/aoff >1, la distribution devient plus nette avec l’augmentation de l’entrée. Ces résultats attendent une identification expérimentale.
Quatrièmement, nous simulons la réponse transcriptionnelle à une entrée variant périodiquement. Le processus microscopique sur un promoteur est plutôt dynamique et stochastique, les différentes composantes de l’AT présentant des stabilités distinctes (figure 3e). Cependant, la quantité d’ARNm peut suivre l’entrée. Ces résultats sont en bon accord avec les résultats révélés par FRAP, c’est-à-dire que le TA est un appareil hautement dynamique8,10,11,22. D’autre part, les simulations de tests d’immunoprécipitation de la chromatine (ChIP), qui caractérisent l’évolution temporelle de la distribution des différents états du promoteur au sein d’une population cellulaire, révèlent une forte régularité dans les distributions (Fig. 3f). Les schémas de liaison des activateurs à l’enhancer et de liaison du SCF et de la Pol II au promoteur suivent l’entrée. Les transcrits d’ARNm sont produits en phase avec l’entrée, tandis que les histones occupent le promoteur en phase inverse. Tous ces résultats correspondent bien aux résultats expérimentaux22,40. Par conséquent, les divergences observées entre les résultats des expériences FRAP et ChIP peuvent provenir des différentes résolutions impliquées dans les mesures. Les mesures ChIP intègrent les interactions moléculaires à la fois dans le temps et sur la population cellulaire, alors que la FRAP reflète plus étroitement les interactions instantanées. De plus, la réponse transcriptionnelle à l’entrée variant dans le temps est robuste au bruit extrinsèque mais sensible aux signaux d’entrée composites et les déviations des principes dynamiques (comme les cas avec un faible taux de cyclage des activateurs, le complexe d’échafaudage instable/espace de type clamp, ou/et un faible taux de réinitiation transcriptionnelle) réduiraient la capacité de réponse (voir les figures S7 et S8).