Caratterizzazione sistematica a livello genomico dei fattori di trascrizione bZIP e dei loro profili di espressione durante lo sviluppo del seme e in risposta allo stress salino nell’arachide
Identificazione, analisi filogenetica e classificazione di gruppo dei geni bZIP in A. duranensis e A. ipaensis
In base alle ricerche di omologia e alla verifica dei domini, un numero totale di 50 e 45 geni bZIP unici sono stati identificati nei genomi di A. duranensis e A. ipaensis, rispettivamente. I dettagli per questi geni, compreso l’ID del gene, la posizione genomica, la composizione del dominio e la classificazione del gruppo sono riportati nel file aggiuntivo 1. Secondo il sistema di nomenclatura esistente, abbiamo assegnato nomi unici a ciascuno di questi nuovi geni bZIP: AdbZIP1-50 e AibZIP1-45. Dopo aver controllato i domini bZIP, 93 geni avevano un tipico dominio bZIP, tra cui un motivo invariante N-× 7-R/K nella regione di base e una ripetizione heptad di Leu posizionata esattamente nove aminoacidi a monte di R/K verso il termine C (Additional file 2). I restanti due geni bZIP, AdbZIP28 e AibZIP22, avevano una sostituzione insolita nella regione di base: una sostituzione del conservato Arg/Lys (R/K) con IIe (I). Questa sostituzione è stata riportata anche in altre specie.
Un’indagine sistematica della famiglia di geni bZIP è stata effettuata per la prima volta in Arabidopsis. In questa analisi, diversi gruppi di geni bZIP sono stati distinti e nominati sulla base delle loro relazioni filogenetiche e divergenze funzionali. Questo sistema di classificazione è stato poi adottato per altre specie sulla base del clustering dei geni bZIP dai loro genomi e da quelli di Arabidopsis. Qui, sulla base di un’analisi di massima verosimiglianza (ML) delle proteine bZIP dai genomi di Arachis e Arabidopsis, abbiamo identificato 11 cladi distinte di geni bZIP (gruppi A-I, S, e U), tutti con alto supporto bootstrap (Fig. 1). La classificazione dei sottogruppi di bZIP di Arachis è stata ulteriormente confermata dalla ricostruzione dell’albero filogenetico dopo l’aggiunta di bZIP dalla soia (file aggiuntivo 3). La maggior parte dei cladi bZIP includono bZIP Arachis strettamente correlati e loro ortologhi Arabidopsis; cladi E e F non hanno membri corrispondenti in A. duranensis o A. ipaensis. In particolare, i geni bZIP all’interno della stessa clade condividevano simili caratteristiche di sequenza specifiche del gruppo, tra cui la struttura esone/introne, le fasi introne, i motivi MEME, e la previsione della struttura del sito di legame (ulteriormente analizzati di seguito). Questo modello di raggruppamento interspecifico ha suggerito che le caratteristiche specifiche del gruppo sono emerse prima della divergenza di Arachis e Arabidopsis. Tuttavia, diverse differenze si sono accumulate anche nei geni bZIP delle diverse specie di piante nel corso del tempo evolutivo.
Struttura genica dei geni bZIP di Arachis
Come l’organizzazione degli introni e degli esoni potrebbe indicare la traiettoria evolutiva dei geni bZIP, abbiamo esaminato la struttura dei geni bZIP di Arachis, compreso il numero di introni, la lunghezza e la fase di splicing (file aggiuntivo 4). Abbiamo trovato che le strutture geniche complessive erano identiche o simili per i bZIP di Arachis all’interno dello stesso gruppo filogenetico. Considerando il numero di introni delle bZIP di arachide, il 24% delle AdbZIP e il 22% delle AibZIP erano senza introni, che si verificano esclusivamente nei gruppi S e B. Tra i geni contenenti introni, il numero di introni variava da 1 a 13 nei geni AdbZIP e AibZIP. i geni bZIP nel gruppo G avevano il maggior numero di introni, in linea con le osservazioni in altri genomi di legumi.
Le fasi di splicing sono state designate come tre fasi di splicing: fase 0 (P0), lo splicing è avvenuto dopo il terzo nucleotide del codone; fase 1 (P1), lo splicing è avvenuto dopo il primo nucleotide del codone; e fase 2 (P2), lo splicing è avvenuto dopo il secondo nucleotide. Le fasi dei siti di splicing all’interno delle cornici di lettura aperte (ORF) erano diverse, ma erano altamente conservate nelle regioni di base e di cerniera del dominio bZIP, perché qualsiasi cambiamento in queste regioni avrebbe influenzato il loro codice e funzione. Sulla base della posizione degli introni e della presenza o del numero di fasi di splicing nel dominio bZIP, sono stati identificati quattro modelli di introni (da a a d) nei geni bZIP di Arachis (Fig. 2 e file aggiuntivo 2). Il modello a aveva un solo introne inserito nella posizione – 5 della regione della cerniera, tra gli aminoacidi Gln e Ala; questo modello è stato identificato in tutti i geni bZIP di Arachis nei gruppi A e G. Il modello b aveva due inserzioni di introni con fase 0, una nella regione di base e l’altra nella regione della cerniera; questo modello è stato identificato in tutti i geni bZIP nel gruppo D. Il pattern c aveva un singolo introne inserito alla posizione – 20 nella regione di base nella fase 2 (P2), e contiene tutti i geni bZIP nei gruppi C e H. Il pattern d mancava di introni nelle regioni di base e di cerniera, e comprende tutti i geni bZIP nei gruppi B e S. Inoltre, la maggior parte dei bZIP di Arachis che mostravano il pattern d erano senza introni, tranne AdbZIP45 e AibZIP40. Ognuno di questi geni aveva un introne al di fuori delle regioni di base e di cerniera. I modelli di fase di splicing nel dominio bZIP di Arachis osservati qui erano coerenti con quelli osservati in altre specie. L’alta conservazione della struttura del gene e delle fasi degli introni all’interno dei cladi filogenetici ha supportato la classificazione di gruppo accettata, e ha suggerito che questi diversi modelli di splicing degli esoni possono giocare un ruolo importante nell’evoluzione funzionale.
Le composizioni dei motivi per diversi gruppi di bZIP di Arachis
Oltre al dominio bZIP, molti altri motivi conservati sono stati rilevati nei geni bZIP dallo strumento di analisi MEME. Come mostrato in Fig. 3, sono stati identificati un totale di 18 motivi conservati al di fuori del dominio bZIP, e sono state costruite le composizioni dei motivi di consenso per ogni sottogruppo (file aggiuntivo 5). Questi motivi di consenso hanno indicato che le composizioni complessive dei motivi erano simili all’interno dello stesso sottogruppo ma diverse tra i diversi gruppi. Questo ha suggerito che la divergenza funzionale dei geni bZIP può essere determinata da motivi specifici del gruppo. L’esame individuale di questi motivi ha indicato che molti erano specifici del gruppo. Per esempio, i motivi 1, 2, 3 e 10 sono stati identificati solo nel gruppo D; i motivi 5, 14 e 15 sono stati identificati solo nel gruppo G; il motivo 6 è stato identificato solo nel gruppo I e il motivo 9 è stato identificato solo nel gruppo H. Molti motivi possono essere associati a funzioni biologiche specifiche. Per esempio, il motivo 1 è il dominio DELAY OF GERMINATION (DOG) 1, che è richiesto per l’induzione della dormienza e molteplici aspetti della maturazione dei semi, in parte interferendo con i componenti di segnalazione ABA. Il motivo 3 contiene potenziali siti di fosforilazione della caseina chinasi II (CK II) (S/TxxD/E), che svolgono un ruolo chiave nella divisione e nell’espansione cellulare e influenzano diversi percorsi di sviluppo e di risposta allo stress. È interessante notare che questi motivi specifici del gruppo sono stati identificati anche in bZIP dello stesso gruppo in altri genomi di legumi, suggerendo che la composizione del motivo è conservata tra le piante di legumi.
Struttura del sito di legame al DNA di Arachis bZIP e proprietà di dimerizzazione
La regione di base centrale e la regione della cerniera del dominio bZIP determinano indipendentemente la specificità del legame al DNA, come dimostrato da diversi esperimenti. L’insolita sostituzione dei due siti invarianti, asparagina (Asn/N; posizione: – 18) e arginina (Arg/R; posizione: – 10), ha alterato le specificità di legame al DNA. Abbiamo allineato le sequenze di aminoacidi delle regioni di base e della cerniera delle proteine bZIP delle arachidi per identificare i residui di aminoacidi conservati e polimorfici all’interno di ciascun gruppo (file aggiuntivo 6). Nessuna sostituzione di Asn/N nella posizione – 18 è stata osservata in nessuna bZIP dell’arachide. Tuttavia, tutti i membri del gruppo I avevano la lisina (Lys/K) al posto dell’arginina (R) nella posizione – 10, coerente con i bZIP del gruppo I di altre specie di legumi. Inoltre, AdbZIP28 e AibZIP22 (gruppo U) avevano un residuo idrofobico di isoleucina (Ile/I) invece di un’arginina (Arg/R), e tale sostituzione ha dimostrato di inibire completamente l’affinità di bZIP per AP1 nel lievito e non riconosce le G-box nel riso .
La sequenza Leu zipper media l’omo- e/o eterodimerizzazione delle proteine bZIP, che sono note per legarsi al DNA come dimeri . La regione Leu zipper consiste di ripetizioni heptad, gli amminoacidi sono riferiti a, b, c, d, e, f, e g all’interno di ogni heptad. Poiché gli amminoacidi nelle posizioni a, d, e e g sono vicini all’interfaccia Leu zipper, questi amminoacidi sono quelli che determinano principalmente l’oligomerizzazione Leu zipper, la stabilità di dimerizzazione e la specificità del dimero. Abbiamo analizzato le composizioni degli aminoacidi che si trovano nelle posizioni a, d, e e g delle bZIP di arachide (Fig. 4a).
In posizione a, circa il 20% dei residui erano asparagina (Asn/N), che può formare una tasca polare nell’interfaccia idrofobica, permettendo interazioni N-N più stabili in a↔a′ (la posizione corrispondente nell’elica opposta), rispetto ad altri aminoacidi. Attraverso le diverse eptadi, la seconda e la quinta eptadi avevano la più alta frequenza di Asn / N residui in posizione a (61,46 e 60,22%, rispettivamente; Fig. 4b). In posizione d (Fig. 4a), il Leu è stato trovato nel 45% di tutte le bZIP di arachidi ed è uno degli amminoacidi alifatici più stabilizzanti del dimero. In posizione e, il 37% di tutte le bZIP di arachidi aveva gli aminoacidi acidi D o E, mentre in posizione g, il 44% di tutte le bZIP di arachidi aveva gli aminoacidi basici R o K (Fig. 4a). Si pensa che questi aminoacidi carichi formino ponti salini tra le eliche nelle interazioni elettrostatiche. Le interazioni elettrostatiche attraenti o repulsive g↔e′ possono anche formare ponti salini interelicali che influenzano la specificità e la stabilità della dimerizzazione. Per indagare il contributo dei residui carichi nelle posizioni e e g nel governare le proprietà di dimerizzazione delle proteine bZIP di Arachis, sono state calcolate le frequenze delle coppie g↔e′ attraenti e repulsive in ogni eptade (Fig. 4c). In tutti gli eptadi, le coppie g↔e′ attraenti erano concentrate nel secondo (15,6%), quinto (35%) e sesto (30%) eptadi, indicando che possono formare interazioni g↔e′ attraenti complete e contribuire alla stabilità attraverso la complementazione in un eterodimero. Tre gruppi che comprendono 28 sottofamiglie (BZ1-BZ28) sono stati ulteriormente suddivisi in base alle proprietà di omo- ed eterodimerizzazione, in particolare la specificità di dimerizzazione (Additional file 7).
L’impatto della duplicazione dell’intero genoma e della duplicazione in tandem sull’espansione della famiglia di geni bZIP di Arachis
Abbiamo identificato i blocchi collineari duplicati nel genoma di A. duranensis e A. ipaensis e i blocchi collineari ortologhi tra due genomi. Le distanze sinonime a coppie (valori Ks) tra i paraloghi e gli ortologhi all’interno dei blocchi collineari sono stati calcolati, e le loro distribuzioni di frequenza sono state tracciate (Fig. 5a; Ks bin = 0,05). Il picco di frequenza Ks tra A. duranensis e A. ipaensis, che rappresenta la variazione media di sequenza, era 0,035. Questo ha rappresentato la divergenza di sequenza tra queste due specie Arachis strettamente correlati, che è stato stimato per aver divergente ~ 2,16 milioni di anni fa . Inoltre, i picchi Ks per A. duranensis e A. ipaensis paralogs erano 0,90 e 0,95, rispettivamente, corrispondenti alla divergenza di sequenza del primo evento di duplicazione del genoma intero papilionoide (WGD) si è verificato ~ 58 milioni di anni fa .
Abbiamo rilevato 35 AdbZIPs e 32 AibZIPs coinvolti in blocchi genomici duplicati, che rappresentano circa il 70% (35/50) e 71% (32/45) dei geni bZIP in ciascuna specie (Fig. 5b e file aggiuntivo 8). Inoltre, le coppie di geni bZIP duplicati si sono verificate all’interno di un cromosoma o tra cromosomi, e alcune di queste coppie sono state duplicate segmentalmente una, due o tre volte. Questo risultato indicava una ritenzione preferenziale dei geni e frequenti disposizioni cromosomiche dopo la WGD. Le duplicazioni in tandem sono state rilevate solo per due coppie di geni (AdbZIP33/AdbZIP34 e AdbZIP41/AdbZIP42) in A. duranensis e solo una coppia di geni (AibZIP28/AibZIP29) in A. ipaensis. Questo ha suggerito che la duplicazione tandem si è verificata raramente e non è stata più importante della duplicazione segmentale nell’espansione della famiglia di geni bZIP. Abbiamo anche usato analisi filogenetiche e sinteniche per identificare 35 coppie di geni bZIP ortologhi tra A. duranensis e A. ipaensis. Questi geni erano anche omeologhi tra i due sottogenomi dell’arachide tetraploide.
Per capire i vincoli evolutivi che agiscono sui geni bZIP di Arachis, abbiamo calcolato i valori Ka/Ks per ogni coppia di geni bZIP duplicati in due specie di Arachis (file aggiuntivo 9). Per la maggior parte di questi confronti a coppie, i valori Ka/Ks erano inferiori a 0,5 (solo un confronto a coppie tra AdbZIP duplicati e solo due tra AibZIP duplicati erano maggiori di 0,5). Questo ha suggerito che una forte selezione purificante ha agito sulle bZIP duplicate di Arachis per rimuovere le mutazioni deleterie a livello proteico.
Analisi dell’espressione dei geni bZIP di Arachis durante lo sviluppo dei semi di arachide
Per tracciare il profilo dell’espressione dei geni bZIP, abbiamo usato i nostri dati RNA-seq precedentemente pubblicati, che documentano l’espressione genica nei semi di arachide in diverse fasi di sviluppo: 20, 40 e 60 giorni dopo la fioritura (DAF). Utilizzando questi dati, abbiamo identificato i valori FPKM per tutte le bZIP di Arachis e tutte le bZIP differenzialmente espresse nelle tre fasi di sviluppo. Con l’eccezione di 24 bZIPs, che non sono stati espressi in qualsiasi fase di sviluppo, quattro gruppi tra cui corrispondenti geni bZIP con profilo di espressione specifica sono stati riconosciuti (Fig. 6a e file aggiuntivo 10). Il primo gruppo comprendeva 37 bZIPs che sono stati up-regolati durante lo sviluppo iniziale (20 DAF), ma down-regolato in seguito (a 40 e 60 DAF). Il secondo gruppo comprendeva 15 bZIPs che erano up-regolati a 40 DAF, mentre il terzo gruppo comprendeva 17 bZIPs che erano down-regolati a 40 DAF. Il quarto gruppo comprendeva 22 bZIP che erano altamente espressi in tutte e tre le fasi di sviluppo. Le bZIP altamente espresse nel quarto gruppo erano principalmente distribuite nei cladi A, C e S. Molte di queste bZIP erano omologhe a geni che sono stati implicati nello sviluppo dei semi in altre piante, come l’Arabidopsis, il riso e il mais. Qui, 12 bZIPs, che erano altamente espressi e omologhi a precedenti geni ben studiati nello sviluppo del seme, sono stati selezionati per la conferma qRT-PCR, e abbiamo trovato che i modelli di espressione determinati da RNA-seq erano coerenti con quelli trovati utilizzando qRT-PCR (Fig. 6b).
Nel gruppo A, AdbZIP33 e AibZIP28 erano ortologhi di Arabidopsis ABA insensibile 5 (ABI5), che è associato con ABA-segnalazione così come la regolazione dello sviluppo dei semi e la longevità in Arabidopsis e legumi. I nostri risultati RNA-seq e qRT-PCR hanno mostrato che entrambe le copie ortologhe ABI5 dai due sottogenomi dell’arachide tetraploide erano altamente espresse durante lo sviluppo, suggerendo che la funzione di questi geni può essere simile in arachide e Arabidopsis. I nostri risultati qRT-PCR hanno anche indicato che i geni del gruppo A AdbZIP42, AdbZIP48 e AibZIP31 erano espressi in modo stabile durante lo sviluppo (Fig. 6b e file addizionale 11). Questi geni sono omologhi a ABFs e AREB, che sono coinvolti nello sviluppo del seme mediato da ABA, germinazione e maturazione dell’embrione. Tre geni nel gruppo C (AdbZIP23, AdbZIP37 e AibZIP30) erano anche altamente espressi e sono omologhi al fattore bZIP del mais Opaque2. Opaque2 regola l’accumulo di proteine e il metabolismo degli aminoacidi e degli zuccheri nei semi di mais. Inoltre, i geni del gruppo S AibZIP10, AdbZIP12, AdbZIP24, AdbZIP26 e AdbZIP36 erano estremamente espressi nei semi di arachide (Fig. 6b e file aggiuntivo 11). È interessante notare che i geni del gruppo S AdbZIP24 e AdbZIP36 avevano un modello di espressione simile ai geni del gruppo C AdbZIP37 e AibZIP30: una diminuzione del livello di espressione con il progredire dello sviluppo del seme.
Abbiamo poi studiato ulteriormente le divergenze di espressione genica tra i geni omeologhi dei genomi AA e BB dell’arachide tetraploide. L’analisi heatmap ha indicato che i modelli generali di espressione attraverso lo sviluppo del seme erano simili per 31 coppie di geni omeologhi/etologhi dai genomi AA e BB. Abbiamo usato il metodo di analisi dell’espressione differenziale in combinazione con metodi statistici per calcolare le differenze di espressione genica tra queste coppie di geni per ogni campione. Abbiamo trovato che 3 coppie di geni (AdbZIP5 e AibZIP5, AdbZIP17 e AibZIP15, AdbZIP46 e AibZIP41) erano differenzialmente espressi a 20 DAF, 3 coppie (AdbZIP3 e AibZIP1, AdbZIP4 e AibZIP4, AdbZIP49 e AibZIP45) a 40 DAF, e 5 coppie (AdbZIP3 e AibZIP1, AdbZIP33 e AibZIP28, AdbZIP37 e AibZIP30, AdbZIP10 e AibZIP10, AdbZIP1 e AibZIP3) a 60 DAF. Questi risultati hanno indicato la conservazione complessiva dell’espressione tra due genomi, ma hanno suggerito che il 20% dei geni avevano divergenza di espressione durante l’evoluzione parallela e la poliploidizzazione di due genomi (Fig. 6c).
Profili di espressione qRT-PCR dei geni bZIP di Arachis sotto stress salino
Abbiamo usato qRT-PCR per esplorare i cambiamenti nell’espressione del gene bZIP in risposta al trattamento con sale (Fig. 7 e file supplementare 12). Non siamo stati in grado di amplificare chiaramente 4 bZIP con la PCR. Dopo che le radici di arachidi sono state trattate con sale per 1 h, 20 geni erano significativamente espressi in modo differenziato; dopo 5 h, 27 geni erano significativamente espressi in modo differenziato; e dopo 10 h, 41 geni erano significativamente espressi in modo differenziato (Fig. 7j; Student’s t test: P < 0.05). Ad ogni punto di tempo, molti più geni sono stati up-regolati che sono stati down-regolati (14 vs. 6 a 1 h; 21 vs. 6 a 5 h; e 34 vs. 7 a 10 h). Tra questi bZIP differenzialmente espressi dopo il trattamento con sale, molti di loro sono stati distribuiti nei gruppi A e S (Fig. 7k), indicando bZIP in questi gruppi svolgono ruoli importanti nella segnalazione di zucchero e regolazione dello stress abiotico.
I bZIP del gruppo A possiedono i motivi del sito di fosforilazione delle protein chinasi CKII e Ca2 + dipendenti coinvolti nello stress e/o nella segnalazione ABA, e questi motivi sono importanti per l’adattamento delle piante a vari stressor ambientali abiotici. Infatti, molti geni del gruppo A sono associati alla risposta allo stress salino. In Arabidopsis, ABI5 e ABFs/AREB sono fattori chiave di trasduzione del segnale ABA-dipendente coinvolti nella tolleranza allo stress abiotico. La sovraespressione di GhABF2 ha migliorato significativamente la tolleranza allo stress salino sia in Arabidopsis che in cotone. Nel pomodoro, slAREB1 e slbZIP1 knockout ha aumentato la tolleranza allo stress salino, mentre slAREB1 e slbZIP1 over-expression ha ridotto la tolleranza allo stress salino. Qui, i geni AdbZIP42 e AibZIP35 sono stati significativamente up-regolati in risposta allo stress salino, e questi geni sono omologhi a ABFs, GhABF2, slAREB1 e slbZIP1. Inoltre, questi geni sono stati segnalati per essere fosforilati dalle protein chinasi SnRK2 attivate dall’ABA, suggerendo che la fosforilazione dei fattori leganti l’elemento di risposta ABA può essere fondamentale per la risposta allo stress salino mediata dall’ABA.
I geni del gruppo B AdbZIP45 e AibZIP40 sono stati up-regolati dopo 10 ore di stress salino, e questi geni sono omologhi a AtbZIP17, che potrebbe migliorare l’espressione di diversi geni di risposta allo stress salino in Arabidopsis. Sette geni bZIP del gruppo G (AdbZIP7, AdbZIP15, AdbZIP19, AdbZIP50, AibZIP17, AibZIP21, e AibZIP38) erano omologhi a AtbZIP41 dell’Arabidopsis e slbZIP38 del pomodoro, e questi geni hanno entrambi dimostrato di regolare negativamente lo stress da sale. Di questi sette geni, AdbZIP15 è stato significativamente down-regolato dopo 1 h e 5 h di trattamento di stress salino, mentre AdbZIP19 e AibZIP17 sono stati significativamente up-regolati dopo 10 h di stress salino. Quindi, AdbZIP15, AdbZIP19 e AibZIP17 potrebbero conferire resistenza allo stress salino. AdbZIP15 potrebbe essere un regolatore negativo dello stress salino, poiché il suo modello di espressione era simile a quello di slbZIP38 in risposta allo stress salino.
I geni del gruppo S AdbZIP24 e AdbZIP36 erano omologhi a AtbZIP1, AtbZIP53, MtbZIP2 e MtbZIP26, e i modelli di espressione di questi geni in risposta allo stress salino erano simili (Fig. 7). In particolare, AdbZIP36 è stato significativamente up-regolato dopo 10 ore di stress salino. Due geni omologhi in Arabidopsis, AtbZIP1 e AtbZIP53, hanno dimostrato di riprogrammare il metabolismo primario dei carboidrati e degli aminoacidi per aiutare le radici ad adattarsi allo stress salino. Gli omologhi MtbZIP2 e MtbZIP26 sono anche trascrizionalmente indotti dal trattamento con sale e migliorano la tolleranza delle piante allo stress salino. In particolare, il modello di espressione di AdbZIP36 era simile a quelli di AtbZIP1, MtbZIP2 e MtbZIP26 in Arabidopsis e M. truncatula, suggerendo che AdbZIP36 potrebbe essere un regolatore positivo della tolleranza allo stress salino nell’arachide. In sintesi, il nostro studio di analisi dell’espressione ha identificato diversi candidati bZIP dell’arachide, che possono essere associati alla risposta allo stress salino, come obiettivi per la ricerca futura.