Meccanismo dinamico per l’apparato di trascrizione che orchestra risposte affidabili agli attivatori
Caratterizzazione matematica della dinamica dell’AT
La dinamica dell’AT è dettata da come i suoi componenti sono organizzati spazialmente e temporalmente sul promotore. Poiché l’AT può assumere molti stati di configurazione distinti e l’evoluzione dello stato è essenzialmente stocastica, coinvolgendo numerose molecole e interazioni complesse, impieghiamo le teorie della statistica e della probabilità per studiare la dinamica dell’AT. Per semplicità, assumiamo che le concentrazioni delle specie associate alla trascrizione, come i GTF, rimangano costanti intorno al gene modello e che le interazioni molecolari che coinvolgono il promotore siano in equilibrio dinamico. Il termine “equilibrio dinamico” non significa che le interazioni molecolari siano tutte reversibili; piuttosto, richiede solo che l’AT recuperi il suo stato attuale dopo un certo tempo. Un gene modello e tutte le specie che lo circondano costituiscono un sistema. Le ipotesi di cui sopra implicano che tale sistema sia in uno stato stazionario. Consideriamo un insieme statistico costituito da un gran numero di tali sistemi essenzialmente identici, ognuno dei quali evolve in modo indipendente. Il numero dei sistemi è abbastanza grande in modo che tutti i possibili stati di configurazione dell’AT possano essere coperti da questo insieme. Cioè, ogni stato subito da un singolo gene mappa gli stati di altri geni nell’insieme e la proporzione di geni in uno stato speciale X (per esempio, geni con i loro enhancer legati da attivatori), P(X), rimane costante nel tempo. Equivalentemente, se un singolo gene viene osservato in qualsiasi momento, la probabilità che il gene sia nello stato X è anche P(X). In questo senso, in quale stato si trova un singolo gene è un evento casuale.
Per il modello minimo (Fig. 1a), definiamo tutti gli stati di configurazione dell’AT come un insieme universale Ω e i vari stati con le stesse caratteristiche chiave come i seguenti sottoinsiemi, rispettivamente (Fig. 1b). A denota che l’enhancer è legato da un attivatore. S denota che il promotore centrale è legato dalle proteine della SCF. M denota che un mRNA nascente è in gestazione (compreso il processo dalla formazione del PIC alla fuga di Pol II in elongazione). J denota che l’attivatore legato all’enhancer è congetturato alla SCF, PIC o OPC attraverso il Mediatore. Poiché l’iniziazione trascrizionale eucariotica richiede la presenza dell’SCF sul promotore centrale4,12, M⊂S. Secondo le definizioni, J⊂AS. Nell’insieme MJ, M e A sono concomitanti, cioè gli attivatori legati all’enhancer possono influenzare direttamente l’azione di Pol II attraverso il Mediatore. Così, l’iniziazione trascrizionale sotto la regolazione diretta degli attivatori è descritta dall’insieme MJ, mentre l’iniziazione trascrizionale basale, indipendente dagli attivatori, è inclusa nell’insieme M-J. La probabilità di un mRNA nascente in gestazione, cioè la probabilità che un mRNA sia generato, è
dove q è una costante che rappresenta l’iniziazione trascrizionale basale e Aj è un sottoinsieme di A (vedi S1 delle informazioni supplementari per i dettagli). In Aj, gli attivatori legati all’enhancer sono obbligati a contattare il mediatore legato a SCF, PIC o OPC. L’equazione (1) caratterizza la relazione tra la produzione di mRNA e le proprietà dinamiche dell’AT.
Codifica la concentrazione di attivatori trascrizionali
Osservando le architetture distinte della cromatina del promotore in diverse fasi trascrizionali, gli attivatori legati all’enhancer possono svolgere varie funzioni, come promuovere l’acetilazione degli istoni e reclutare le GTF4,5,15. In particolare, il set Aj coinvolge gli attivatori legati all’enhancer che sono responsabili della gestione del macchinario trascrizionale basale e del controllo dell’iniziazione trascrizionale. Inoltre, le attività di questi attivatori sono anche associati con la codifica della concentrazione nucleare di attivatori, per è l’unico fattore in equazione (1) dipende dalla concentrazione di attivatori. Qui, indaghiamo la dinamica di tali attivatori.
Gli attivatori si muovono rapidamente all’interno del nucleo e la probabilità che raggiungano l’enhancer è proporzionale alla loro abbondanza nucleare9. Consideriamo un periodo di tempo, durante il quale gli attivatori coinvolti nel set Aj si legano e poi si allontanano dall’enhancer per m (m = 1, 2, 3, …) cicli. Definiamo il tasso di occupazione temporale RTOR di questi attivatori come , dove e indicano rispettivamente il tempo di binding e di unbinding del ciclo j-esimo. Per il numero fisso na di attivatori nel nucleo, abbiamo
dove aon e aoff sono le funzioni di propensione del legame e del dislegame, rispettivamente (vedi S2 delle informazioni supplementari per i dettagli). aon è una funzione di na, mentre aoff è indipendente da na. L’equazione (2) indica che con l’aumentare di m, converge verso un valore deterministico, che è una funzione monotonamente crescente di na (Fig. 1c-d e Fig. S1; questa è una proprietà generale e può essere applicata ai casi in cui il numero di siti di legame cognitivo sul potenziatore è maggiore di uno (vedi equazioni S13-S18)). Questa convergenza implica che anche la concentrazione variabile nel tempo degli attivatori può essere codificata da RTOR, a condizione che gli attivatori si accendano e si spengano dall’enhancer abbastanza frequentemente in una finestra temporale con la loro concentrazione quasi invariata. Infatti, ci sono meccanismi di dissociazione attivi che garantiscono la rapida ciclicità degli attivatori9,19,20,21,22. Il tempo di legame è stato stimato nell’intervallo da secondi a decine di secondi9,10. Inoltre, è stato dimostrato sul gene endogeno CUP1 che tale ciclaggio rapido è funzionale10. Presumibilmente, il RTOR codifica la concentrazione di attivatori trascrizionali. D’altra parte, durante il periodo di tempo in cui gli attivatori si accendono e si spengono dall’enhancer per m volte, la probabilità che l’enhancer si trovi legato da un tale attivatore è . Poiché la media di sull’insieme è anche f(na), abbiamo
Le condizioni di vincolo che assicurano risposte trascrizionali affidabili
Data la stocasticità nel verificarsi degli eventi trascrizionali, per ottenere una risposta trascrizionale affidabile occorre che il codice RTOR, che rappresenta puntualmente la concentrazione di attivatori, sia trasdotto con alta fedeltà nella quantità di trascritti. Idealmente, se P(S), e fossero tutti uguali a 1, l’esatta trasduzione dell’informazione sarebbe compiuta. Di seguito, presentiamo le condizioni in cui questi tre fattori possono essere abbastanza grandi da garantire risposte trascrizionali affidabili in presenza di fluttuazioni casuali (le Figg. S2 e S3 forniscono spiegazioni intuitive per questa sottosezione).
L’equazione (3) implica che la concentrazione di attivatori non può essere sufficientemente codificata senza la persistenza della SCF sul promotore. Così, la SCF dovrebbe assemblarsi rapidamente quando l’architettura della cromatina lo permette ed essere molto più stabile degli attivatori legati all’enhancer (condizione I). Tale stabilità della SCF è stato osservato sperimentalmente e il tempo di legame di TBP (TATA-binding protein, il componente centrale della SCF) sul promotore può essere fino a 20 min in cellule umane11. Per , Aj è una precondizione del verificarsi di J. Poiché RTOR è determinato dai singoli tempi brevi di legame degli attivatori, J dovrebbe avvenire immediatamente dopo il verificarsi di Aj (Fig. S3). In caso contrario, le informazioni su RTOR è in gran parte perso o addirittura falsamente utilizzato per dirigere l’avvio trascrizionale (si noti che J è una precondizione di M). Pertanto, per trasferire correttamente il codice RTOR, il Mediatore dovrebbe agire aspettando di legare gli attivatori ciclici e trasmettere le informazioni attraverso l’allosteria23,24,25 (Condizione II). Questo perché altri tipi di interazioni molecolari come le collisioni libere non possono trasmettere con precisione le informazioni sul tempo di legame degli attivatori. Tale allosterismo del Mediator è supportato dal lavoro precedente26. determina come le informazioni su RTOR ereditate da J sono convertite per guidare la quantità di trascrizioni. Poiché RTOR dipende dal legame intermittente di attivatori, un grande richiede che durante i brevi periodi di legame, trascrizioni dovrebbe essere prodotto ad un tasso piuttosto rapido (Fig. S2) (Condizione III). Questa caratteristica è verificata anche dalle stime computazionali dei dati sperimentali (vedi S3 delle informazioni supplementari). Pertanto, tutte e tre le condizioni possono essere soddisfatte naturalmente.
Il meccanismo dinamico della trascrizione regolata dall’attivatore
Le tre condizioni di vincolo di cui sopra determinano insieme il funzionamento dell’AT. Si verifica ripetutamente uno stato in cui si forma uno spazio relativamente stabile di tipo clamp tra il mediatore e l’enhancer (Fig. 2; secondo le condizioni I e II). Poiché è stato dimostrato sperimentalmente che l’SCF non è molto stabile11 , questo spazio viene costruito temporaneamente. Lo spazio simile a una pinza attira gli attivatori liberi e poi li stacca rapidamente, con RTOR deciso dalla concentrazione degli attivatori (secondo le equazioni (2-3)). Una volta che una molecola di attivatore entra in questo spazio, nasce l’allosteria nel Mediatore, con il risultato di una circostanza facilitata per le GTF e altre proteine correlate a svolgere le loro funzioni. Di conseguenza, le Pol II possono iniziare/riavviare la trascrizione molto rapidamente (secondo le condizioni II e III), con il RTOR che regola la quantità dei trascritti.
Questo meccanismo suggerisce che le interazioni molecolari che coinvolgono il promotore obbediscono a eleganti principi dinamici come segue. Mentre lo spazio simile a un morsetto si forma temporaneamente, esso è molto più stabile degli attivatori che vi si insediano. Gli attivatori possono entrare e uscire dallo spazio per molte volte anche durante brevi episodi in cui la loro concentrazione rimane quasi invariata; così, la concentrazione degli attivatori può essere rappresentata da RTOR in modo tempestivo. Poiché il mediatore trasmette l’informazione attraverso l’allosteria e il tasso di reiniziazione trascrizionale è molto più grande del tasso di ciclaggio degli attivatori, il codice RTOR è efficacemente impiegato per dirigere la sintesi dell’mRNA. In una parola, lo spazio a pinza è la base strutturale per risposte trascrizionali affidabili. Piuttosto che essere un ostacolo, la natura stocastica delle interazioni molecolari è pienamente utilizzata per indurre la trascrizione in modo affidabile; questo dipende in gran parte dai diversi gradi di stabilità dei componenti dell’AT, che si estendono su diversi ordini di grandezza. Gli argomenti di cui sopra sono supportati da dati sperimentali e le scale temporali tipiche sono le seguenti: il tempo di dimezzamento dello spazio simile al morsetto è di circa 5 min11, il tempo di occupazione degli attivatori nello spazio è compreso tra secondi e decine di secondi10, l’allosteria di solito avviene in un tempo che va da millisecondi a non più di 1 secondo23,24,25 e sono sufficienti diversi secondi per reiniziare una trascrizione (vedi S3 delle informazioni supplementari).
Convalida del meccanismo mediante simulazioni numeriche
Per verificare ulteriormente il meccanismo dinamico proposto, costruiamo un modello stocastico semplificato della trascrizione genica con parametri fisiologicamente realistici (vedi Fig. S4 e S4 nelle Informazioni supplementari per i dettagli). Questo modello raffigura le transizioni di stato chiave dell’AT e descrive anche semplicemente la relativa dinamica della cromatina, quindi in grado di caratterizzare la risposta trascrizionale agli attivatori trascrizionali. Nel seguito, “input” e “output” indicano la concentrazione nucleare di attivatori e la quantità di prodotti genici, mRNA o proteine, rispettivamente.
In primo luogo, esploriamo l’evoluzione temporale del numero di mRNA cellulari a livelli di input costante (Fig. 3a). In particolare, gli mRNA sono prodotti in modo burst-like, in linea con la visione prevalente14,27,28,29,30,31,32. Per gli ingressi di basso livello, un allele viene trascritto mentre l’altro è silenzioso in una cellula diploide e quindi il fenomeno bursting è evidente. Per gli input di alto livello, tuttavia, entrambi gli alleli scoppiano frequentemente così che la somma diventa quasi costante. Questo suggerisce che il fenotipo di persistenti risposte trascrizionali elevate può essere osservato ad alti livelli di input14.
Una recente analisi sperimentale ha precluso la possibilità che l’ambiente cromatina gioca un ruolo centrale nel plasmare bursting trascrizionale32. Qui, dimostriamo che un burst di trascrizioni ha origine dalla reinizializzazione persistente da Pol IIs quando lo spazio clamp-like è occupato dagli attivatori (Fig. 4). Cioè, l’iniziazione di mRNA è essa stessa burst-like. Il burst non è un semplice rumore; è invece una manifestazione diretta del codice RTOR, che rappresenta la concentrazione degli attivatori e guida la produzione di mRNA.
In secondo luogo, studiamo la relazione media input/output della risposta trascrizionale. L’uscita media assomiglia a una funzione Hill dell’ingresso, che è ampiamente utilizzato in biologia dei sistemi per modellare l’espressione genica3,33,34 (Fig. 3b). La curva della deviazione standard SDout dell’output contro l’input è approssimativamente a forma di campana (Fig. 3c). L’intensità del rumore intrinseco, definito come il rapporto tra SDout e l’uscita media35, è inversamente correlato con l’ingresso (il riquadro di Fig. 3b). Inoltre, le caratteristiche di cui sopra sono insensibili alle lievi fluttuazioni in ingresso (cioè, il rumore estrinseco) (Fig. S5), suggerendo la robustezza della risposta trascrizionale al rumore. Tutti questi risultati sono in buon accordo con le misure sperimentali sia in Saccharomyces cerevisiae36 e Drosophila embrioni37. In particolare, il lato sinistro della curva SDout è inferiore al suo lato destro; questa caratteristica è quasi quantitativamente in accordo con i dati sperimentali37 (vedi S5 delle informazioni supplementari per ulteriori discussioni). Al contrario, deviazioni dai principi dinamici proposti sopra (comprese le circostanze in cui il ciclismo degli attivatori è lento, il complesso scaffold / clamp-like spazio non è stabile, o / e il tasso di reinizializzazione trascrizionale è basso) ridurrebbe la capacità del TA di rispondere in modo affidabile per l’ingresso (Fig. S6).
Il rapporto ingresso / uscita osservato in embrioni Drosophila è stato creduto per essere realizzato utilizzando al massimo il limite delle interazioni molecolari37,38,39. Le proprietà di tali interazioni microscopiche sono integrate per essere manifestate macroscopicamente come SDout. La curva SDout è ancora a forma di campana nel complesso rispetto alla curva SDin (cfr. Fig. 1d). Cioè, la firma del codice RTOR può essere trasmessa direttamente all’uscita. Questo conferma che il tasso di occupazione temporale degli attivatori è realmente sfruttato per regolare la trascrizione e il Mediatore trasmette l’informazione attraverso l’allosteria. D’altra parte, la curva SDout è asimmetrica, con il lato destro più alto di quello sinistro. La ragione è ovvia. Quando l’input è molto alto, l’enhancer è legato dagli attivatori quasi tutto il tempo e quindi le fluttuazioni riflettono principalmente le proprietà dinamiche della SCF e la reiniziazione trascrizionale da parte della Pol II. Le nostre ulteriori simulazioni mostrano che il lato destro della curva SDout scende man mano che la stabilità della SCF o il tasso di reiniziazione trascrizionale è aumentato; solo quando si aumenta la loro forza oltre gli intervalli fisiologici la curva può diventare simmetrica (Fig. S6F). Questo verifica anche che sia P(S) che sono effettivamente abbastanza grandi. Pertanto, le proprietà di SDout dovrebbe dimostrare definitivamente il meccanismo microscopico trascrizionale.
In terzo luogo, sondiamo la distribuzione dei livelli di mRNA in una popolazione di cellule di grandi dimensioni esposte allo stesso ingresso (Fig. 3d). Per piccoli input, il fenomeno di bursting è particolarmente evidente e la maggior parte delle cellule non hanno o hanno pochi mRNA. Questo è coerente con l’osservazione sperimentale27,30,31. Ma la distribuzione diventa gradualmente normale all’aumentare dell’input. Per aon/aoff >1, la distribuzione diventa più nitida con l’aumento dell’input. Questi risultati attendono l’identificazione sperimentale.
In quarto luogo, simuliamo la risposta trascrizionale a un input che varia periodicamente. Il processo microscopico su un promotore è piuttosto dinamico e stocastico, con diverse componenti dell’AT che esibiscono stabilità distinte (Fig. 3e). Tuttavia, la quantità di mRNA può seguire l’input. Questi risultati sono in buon accordo con i risultati rivelati da FRAP, cioè, l’AT è un apparato altamente dinamico 8,10,11,22. D’altra parte, le simulazioni di immunoprecipitazione della cromatina (ChIP), che caratterizzano l’evoluzione temporale della distribuzione dei diversi stati del promotore tra una popolazione di cellule, rivelano una forte regolarità nelle distribuzioni (Fig. 3f). I modelli di entrambi gli attivatori che si legano all’enhancer e di SCF e Pol II che si legano al promotore seguono l’input. I trascritti di mRNA sono prodotti in fase con l’input, mentre gli istoni occupano il promotore in una fase inversa. Tutti questi risultati sono ben coerenti con i risultati sperimentali22,40. Pertanto, le discrepanze osservate tra i risultati da FRAP e ChIP esperimenti possono provenire da diverse risoluzioni coinvolti nelle misure. Le misure ChIP integrano le interazioni molecolari sia temporalmente che sulla popolazione cellulare, mentre FRAP riflette più strettamente le interazioni istantanee. Inoltre, la risposta trascrizionale all’input variabile nel tempo è robusta al rumore estrinseco ma sensibile ai segnali di input compositi e le deviazioni dai principi dinamici (come i casi con basso tasso di ciclismo degli attivatori, il complesso di scaffold instabile/spazio simil-campo, o/e basso tasso di reiniziazione trascrizionale) ridurrebbe la capacità di risposta (vedi Figg. S7 e S8).