Caracterizarea sistematică la nivel de genom a factorilor de transcripție bZIP și a profilurilor lor de expresie în timpul dezvoltării semințelor și ca răspuns la stresul salin la arahide
Identificarea, analiza filogenetică și clasificarea pe grupe a genelor bZIP în A. duranensis și A. ipaensis
Pe baza căutărilor de homologie și a verificării domeniilor, a fost identificat un număr total de 50 și 45 de gene bZIP unice în genomurile A. duranensis și, respectiv, A. ipaensis. Detaliile pentru aceste gene, inclusiv ID-ul genei, poziția genomică, compoziția domeniului și clasificarea grupului sunt prezentate în fișierul suplimentar 1. În conformitate cu sistemul de nomenclatură existent, am atribuit nume unice fiecăreia dintre aceste noi gene bZIP: AdbZIP1-50 și AibZIP1-45. După verificarea domeniilor bZIP, 93 de gene aveau un domeniu bZIP tipic, inclusiv un motiv invariabil N-× 7-R/K în regiunea de bază și o repetare heptadă a lui Leu poziționată exact nouă aminoacizi în amonte de R/K spre terminația C (fișier suplimentar 2). Celelalte două gene bZIP rămase, AdbZIP28 și AibZIP22, au avut o substituție neobișnuită în regiunea de bază: o înlocuire a conservatului Arg/Lys (R/K) cu IIe (I). Această înlocuire a fost raportată și la alte specii .
O investigație sistematică a familiei de gene bZIP a fost efectuată pentru prima dată la Arabidopsis . În această analiză, diferite grupuri de gene bZIP au fost distinse și denumite pe baza relațiilor lor filogenetice și a divergențelor funcționale. De atunci, acest sistem de clasificare a fost adoptat pentru alte specii pe baza grupării genelor bZIP din genomul propriu și din cel al Arabidopsis . Aici, pe baza unei analize de maximă verosimilitate (ML) a proteinelor bZIP din genomurile Arachis și Arabidopsis, am identificat 11 clade distincte de gene bZIP (grupurile A-I, S și U), toate cu un sprijin bootstrap ridicat (Fig. 1). Clasificarea pe subgrupuri a bZIP-urilor din Arachis a fost confirmată în continuare prin reconstrucția arborelui filogenetic după adăugarea bZIP-urilor din soia (fișier suplimentar 3). Majoritatea cladelor bZIP includ bZIP-uri din Arachis strâns înrudite și ortologii lor din Arabidopsis; cladele E și F nu au membri corespunzători în A. duranensis sau A. ipaensis. În special, genele bZIP din cadrul aceleiași clade au împărtășit caracteristici de secvență similare specifice grupului, inclusiv structura exonului/intronului, fazele intronilor, motivele MEME și predicția structurii situsului de legare (analizate în continuare mai jos). Acest model de grupare interspecifică a grupurilor a sugerat că caracteristicile specifice grupului au apărut înainte de divergența dintre Arachis și Arabidopsis. Cu toate acestea, mai multe diferențe s-au acumulat, de asemenea, în genele bZIP ale diferitelor specii de plante de-a lungul timpului evolutiv.
Structura genică a genelor bZIP din Arachis
Deoarece organizarea intronilor și exonilor ar putea indica traiectoria evolutivă a genelor bZIP , am examinat structura genelor bZIP din Arachis, inclusiv numărul de introni, lungimea și faza de splicing (fișier suplimentar 4). Am constatat că structurile generale ale genelor au fost identice sau similare pentru bZIP-urile Arachis din cadrul aceluiași grup filogenetic. Luând în considerare numărul de introni ai bZIP-urilor din arahide, 24% din AdbZIP-uri și 22% din AibZIP-uri au fost fără introni, apărând exclusiv în grupurile S și B. În rândul genelor care conțin introni, numărul de introni a variat de la 1 la 13 în genele AdbZIP și AibZIP. Genele bZIP din grupul G au avut cei mai mulți introni, în concordanță cu observațiile din alte genomuri de leguminoase .
Fazele de splicing au fost desemnate ca trei faze de splicing: faza 0 (P0), splicingul a avut loc după a treia nucleotidă a codonului; faza 1 (P1), splicingul a avut loc după prima nucleotidă a codonului; și faza 2 (P2), splicingul a avut loc după a doua nucleotidă. Fazele situsurilor de splicing în cadrul cadrelor de lectură deschise (ORF) au fost diverse, dar au fost foarte conservate în regiunile de bază și de balama ale domeniului bZIP, deoarece orice modificări în aceste regiuni ar afecta codul și funcția acestora. Pe baza poziției intronilor și a prezenței sau a numărului de faze de splicing în domeniul bZIP, au fost identificate patru modele de introni (de la a la d) în genele bZIP din Arachis (Fig. 2 și fișier suplimentar 2). Modelul a a avut doar un singur intron inserat în poziția – 5 a regiunii de balama, între aminoacizii Gln și Ala; acest model a fost identificat în toate genele bZIP Arachis din grupurile A și G. Modelul b a avut două inserții de introni cu faza 0, una în regiunea de bază și cealaltă în regiunea de balama; acest model a fost identificat în toate genele bZIP din grupul D. Modelul c a avut un singur intron inserat în poziția – 20 în regiunea de bază în faza 2 (P2) și conține toate genele bZIP din grupele C și H. Modelul d nu avea introni în regiunile de bază și de balama și include toate genele bZIP din grupele B și S. În plus, majoritatea bZIP-urilor din Arachis care prezintă modelul d nu aveau introni, cu excepția AdbZIP45 și AibZIP40. Fiecare dintre aceste gene avea câte un intron în afara regiunilor de bază și de balama. Modelele de fază de splicing în domeniul bZIP din Arachis observate aici au fost în concordanță cu cele observate la alte specii . Conservarea ridicată a structurii genei și a fazelor intronilor în cadrul cladelor filogenetice a susținut clasificarea de grup acceptată și a sugerat că aceste modele diferite de splicing al exonilor pot juca un rol important în evoluția funcțională.
Compozițiile motivelor pentru diferite grupuri de bZIP-uri din Arachis
În plus față de domeniul bZIP, multe motive conservate suplimentare au fost detectate în genele bZIP cu ajutorul instrumentului de analiză MEME. După cum se arată în Fig. 3, au fost identificate în total 18 motive conservate în afara domeniului bZIP și au fost construite compozițiile consensuale ale motivelor pentru fiecare subgrup (fișier suplimentar 5). Aceste motive consensuale au indicat faptul că compozițiile generale ale motivelor au fost similare în cadrul aceluiași subgrup, dar diferite între diferitele grupuri. Acest lucru a sugerat că divergența funcțională a genelor bZIP poate fi determinată de motive specifice grupului. Examinarea individuală a acestor motive a indicat faptul că multe dintre ele erau specifice grupului. De exemplu, motivele 1, 2, 3 și 10 au fost identificate numai în grupul D; motivele 5, 14 și 15 au fost identificate numai în grupul G; motivul 6 a fost identificat numai în grupul I; iar motivul 9 a fost identificat numai în grupul H. Mai multe motive pot fi asociate cu funcții biologice specifice. De exemplu, motivul 1 este domeniul DELAY OF GERMINATION (DOG) 1, care este necesar pentru inducerea latenței și multiple aspecte ale maturării semințelor, în parte prin interferența cu componentele de semnalizare ABA . Motivul 3 conține potențiale situsuri de fosforilare a cazeină kinazei II (CK II) (S/TxxD/E), care joacă un rol-cheie în diviziunea și expansiunea celulară și afectează diverse căi de dezvoltare și de răspuns la stres . În mod interesant, aceste motive specifice grupului au fost identificate, de asemenea, în bZIP-uri din același grup în alte genomuri de leguminoase , sugerând că compoziția motivelor este conservată între plantele leguminoase.
Structura situsului de legare la ADN bZIP din Arachis și proprietățile de dimerizare
Regiunea de bază centrală și regiunea de balama a domeniului bZIP determină în mod independent specificitatea de legare la ADN, așa cum s-a demonstrat prin mai multe experimente . Înlocuirea neobișnuită a celor două situsuri invariante, asparagina (Asn/N; poziția: – 18) și arginina (Arg/R; poziția: – 10), a alterat specificitatea de legare la ADN . Am aliniat secvențele de aminoacizi ale regiunilor de bază și de balama ale proteinelor bZIP din arahide pentru a identifica reziduurile de aminoacizi conservate și polimorfe în cadrul fiecărui grup (fișier suplimentar 6). Nu au fost observate înlocuiri de Asn/N în poziția – 18 în nicio bZIP de arahide. Cu toate acestea, toți membrii grupului I aveau lizină (Lys/K) în loc de arginină (R) la poziția – 10, în concordanță cu bZIP-urile din grupul I de la alte specii de leguminoase . În plus, AdbZIP28 și AibZIP22 (grupa U) aveau un reziduu hidrofob de izoleucină (Ile/I) în loc de arginină (Arg/R), și s-a demonstrat că o astfel de înlocuire inhibă complet afinitatea bZIP pentru AP1 în drojdie și nu recunoaște cutiile G în orez .
Secvența zipper Leu mediază homo- și/sau heterodimerizarea proteinelor bZIP, despre care se știe că se leagă de ADN sub formă de dimeri . Regiunea Leu zipper este formată din repetări heptadice, aminoacizii sunt denumiți a, b, c, d, e, f și g în cadrul fiecărei heptade . Deoarece aminoacizii din pozițiile a, d, e și g se află în apropierea interfeței Leu zipper, acești aminoacizi sunt cei care determină în principal oligomerizarea Leu zipper, stabilitatea dimerizării și specificitatea dimerului. Am analizat compozițiile aminoacizilor care se găsesc în pozițiile a, d, e și g ale bZIP-urilor din arahide (Fig. 4a).
În poziția a, aproximativ 20% din reziduuri erau asparagină (Asn/N), care poate forma un buzunar polar în interfața hidrofobă, permițând interacțiuni N-N mai stabile la a↔a′ (poziția corespunzătoare în helixul opus), în comparație cu alți aminoacizi . În cadrul diferitelor heptade, a doua și a cincea heptade au avut cea mai mare frecvență de reziduuri Asn/N în poziția a (61,46 și, respectiv, 60,22 %; Fig. 4b). În poziția d (Fig. 4a), Leu a fost găsit în 45% din toate bZIP-urile de arahide și este unul dintre cei mai stabilizatori aminoacizi alifatici care stabilizează dimerii . La poziția e, 37% din toate bZIP-urile de arahide aveau aminoacizii acizi D sau E, în timp ce la poziția g, 44% din toate bZIP-urile de arahide aveau aminoacizii bazici R sau K (Fig. 4a). Se crede că acești aminoacizi încărcați formează punți de sare între elice în interacțiuni electrostatice . Interacțiunile electrostatice atractive sau repulsive g↔e′ pot, de asemenea, să formeze punți de sare interhelicoidale care afectează specificitatea și stabilitatea dimerizării . Pentru investigarea contribuției reziduurilor încărcate din pozițiile e și g în guvernarea proprietăților de dimerizare ale proteinelor bZIP din Arachis, au fost calculate frecvențele perechilor atractive și repulsive g↔e′ în fiecare heptadă (Fig. 4c). În toate heptadele, perechile g↔e′ atractive au fost concentrate în a doua (15,6 %), a cincea (35 %) și a șasea (30 %) heptadă, ceea ce indică faptul că acestea pot forma interacțiuni g↔e′ atractive complete și contribuie la stabilitate prin complementaritate într-un heterodimer. Trei grupuri care cuprind 28 de subfamilii (BZ1-BZ28) au fost împărțite în continuare pe baza proprietăților de homo- și heterodimerizare, în special a specificității de dimerizare (Fișier suplimentar 7).
The impact of whole genome duplication and tandem duplication on the expansion of Arachis bZIP gene family
Am identificat blocurile duplicate coliniar la nivelul genomului în genomul A. duranensis și A. ipaensis și blocurile coliniar ortologe între două genomuri. S-au calculat distanțele sinonime pe perechi (valorile Ks) între paralogi și ortologi în cadrul blocurilor coliniarizate, iar distribuțiile de frecvență ale acestora au fost reprezentate grafic (Fig. 5a; Ks bin = 0,05). Frecvența Ks maximă între A. duranensis și A. ipaensis, reprezentând variația medie a secvenței, a fost de 0,035. Aceasta a reprezentat divergența de secvență dintre aceste două specii de Arachis strâns înrudite, care a fost estimată ca fiind divergentă cu ~ 2,16 milioane de ani în urmă . Mai mult, vârfurile Ks pentru paralogii A. duranensis și A. ipaensis au fost de 0,90 și, respectiv, 0,95, ceea ce corespunde divergenței de secvență a evenimentului timpuriu de duplicare a întregului genom papilionoid (WGD) care a avut loc cu ~ 58 milioane de ani în urmă .
Am detectat 35 AdbZIP și 32 AibZIP implicate în blocuri genomice duplicate, reprezentând aproximativ 70% (35/50) și 71% (32/45) din genele bZIP în fiecare specie (Fig. 5b și Fișierul suplimentar 8). Mai mult, perechile de gene bZIP duplicate au apărut fie în interiorul unui cromozom, fie între cromozomi, iar unele dintre aceste perechi au fost duplicate segmentar o dată, de două sau de trei ori. Acest rezultat a indicat o retenție preferențială a genelor și aranjamente cromozomiale frecvente după WGD. S-au detectat duplicații în tandem doar pentru două perechi de gene (AdbZIP33/AdbZIP34 și AdbZIP41/AdbZIP42) la A. duranensis și doar o singură pereche de gene (AibZIP28/AibZIP29) la A. ipaensis. Acest lucru sugerează că duplicarea în tandem a avut loc rar și nu a fost mai importantă decât duplicarea segmentară în extinderea familiei de gene bZIP. Am folosit, de asemenea, analize filogenetice și sintenice pentru a identifica 35 de perechi de gene bZIP ortologe între A. duranensis și A. ipaensis. Aceste gene erau, de asemenea, homeologe între cele două subgenomuri ale arahidei tetraploide.
Pentru a înțelege constrângerile evolutive care acționează asupra genelor bZIP din Arachis, am calculat valorile Ka/Ks pentru fiecare pereche de gene bZIP duplicată în două specii de Arachis (Fișier suplimentar 9). Pentru majoritatea acestor comparații pe perechi, valorile Ka/Ks au fost mai mici de 0,5 (doar o singură comparație pe perechi între AdbZIP-uri duplicate și doar două între AibZIP-uri duplicate au fost mai mari de 0,5). Acest lucru a sugerat că o selecție purificatoare puternică a acționat asupra bZIP-urilor duplicate din Arachis pentru a elimina mutațiile dăunătoare la nivel proteic.
Analiză de expresie a genelor bZIP din Arachis în timpul dezvoltării semințelor de arahide
Pentru a trasa profilul expresiei genelor bZIP, am folosit datele noastre RNA-seq publicate anterior , care documentează expresia genelor în semințele de arahide în diferite stadii de dezvoltare: 20, 40 și 60 de zile după înflorire (DAF). Folosind aceste date, am identificat valorile FPKM pentru toate bZIP-urile din Arachis și toate bZIP-urile exprimate diferențiat în cele trei stadii de dezvoltare. Cu excepția a 24 de bZIP-uri, care nu au fost exprimate în niciun stadiu de dezvoltare, au fost recunoscute patru grupuri care includ genele bZIP corespunzătoare cu profil de expresie specific (Fig. 6a și fișierul suplimentar 10). Primul grup a cuprins 37 de bZIP-uri care au fost reglate în sus în timpul dezvoltării timpurii (20 DAF), dar au fost reglate în jos ulterior (la 40 și 60 DAF). Al doilea grup a cuprins 15 bZIP-uri care au fost reglate în sus la 40 DAF, în timp ce al treilea grup a cuprins 17 bZIP-uri care au fost reglate în jos la 40 DAF. Al patrulea grup cuprindea 22 de bZIP-uri care au fost foarte bine exprimate în toate cele trei stadii de dezvoltare. BZIP-urile foarte bine exprimate din grupul patru au fost distribuite în principal în cladele A, C și S. Câteva dintre aceste bZIP-uri au fost omoloage cu gene care au fost implicate în dezvoltarea semințelor la alte plante, cum ar fi Arabidopsis , orez și porumb . Aici, 12 bZIP-uri, care au fost foarte bine exprimate și omoloage cu gene anterioare bine studiate în dezvoltarea semințelor, au fost selectate pentru confirmarea prin qRT-PCR și s-a constatat că modelele de expresie determinate prin RNA-seq au fost în concordanță cu cele găsite cu ajutorul qRT-PCR (Fig. 6b).
În grupul A, AdbZIP33 și AibZIP28 au fost ortologi cu Arabidopsis ABA insensibil 5 (ABI5), care este asociat cu semnalizarea ABA, precum și cu reglarea dezvoltării semințelor și a longevității la Arabidopsis și leguminoase . Rezultatele noastre RNA-seq și qRT-PCR au arătat că ambele copii ortologe ABI5 din cele două subgenomuri ale arahidei tetraploide au fost puternic exprimate în timpul dezvoltării, sugerând că funcția acestor gene poate fi similară la arahide și Arabidopsis. Rezultatele noastre qRT-PCR au indicat, de asemenea, că genele grupului A AdbZIP42, AdbZIP48 și AibZIP31 au fost exprimate în mod stabil în timpul dezvoltării (Fig. 6b și fișierul suplimentar 11). Aceste gene sunt omologe cu ABFs și AREB, care sunt implicate în dezvoltarea semințelor mediată de ABA, germinarea și maturarea embrionară . Trei gene din grupul C (AdbZIP23, AdbZIP37 și AibZIP30) au fost, de asemenea, puternic exprimate și sunt omoloage cu factorul bZIP Opaque2 din porumb. Opaque2 reglează acumularea de proteine și metabolismul aminoacizilor și al zahărului în semințele de porumb . În plus, genele grupului S AibZIP10, AdbZIP12, AdbZIP24, AdbZIP26 și AdbZIP36 au fost extrem de puternic exprimate în semințele de arahide (Fig. 6b și Fișierul suplimentar 11). În mod interesant, genele din grupul S AdbZIP24 și AdbZIP36 au avut un model de expresie similar cu genele din grupul C AdbZIP37 și AibZIP30: o scădere a nivelului de expresie pe măsură ce dezvoltarea semințelor a progresat.
Apoi am investigat în continuare divergențele în expresia genelor între genele homeologe din genomurile AA și BB ale arahidei tetraploide. Analiza hărții termice a indicat faptul că modelele generale de expresie de-a lungul dezvoltării semințelor au fost similare pentru 31 de perechi de gene homeologe/ortologe din genomurile AA și BB. Am utilizat metoda de analiză a expresiei diferențiale în combinație cu metode statistice pentru a calcula diferențele în expresia genelor între aceste perechi de gene pentru fiecare eșantion. Am constatat că 3 perechi de gene (AdbZIP5 și AibZIP5, AdbZIP17 și AibZIP15, AdbZIP46 și AibZIP41) au fost exprimate diferențiat la 20 DAF, 3 perechi (AdbZIP3 și AibZIP1, AdbZIP4 și AibZIP4, AdbZIP49 și AibZIP45) la 40 DAF, și 5 perechi (AdbZIP3 și AibZIP1, AdbZIP33 și AibZIP28, AdbZIP37 și AibZIP30, AdbZIP10 și AibZIP10, AdbZIP1 și AibZIP3) la 60 DAF. Aceste rezultate au indicat conservarea generală a expresiei între cele două genomuri, dar au sugerat că 20% dintre gene au avut divergențe de expresie în timpul evoluției paralele și a poliploidizării celor două genomuri (Fig. 6c).
Profilele de expresie qRT-PCR ale genelor bZIP din Arachis în condiții de stres salin
Am folosit qRT-PCR pentru a explora modificările în expresia genelor bZIP ca răspuns la tratamentul cu sare (Fig. 7 și Fișierul suplimentar 12). Nu am reușit să amplificăm în mod clar 4 bZIP-uri cu PCR. După ce rădăcinile de arahide au fost tratate cu sare timp de 1 h, 20 de gene au fost exprimate în mod semnificativ în mod diferențiat; după 5 h, 27 de gene au fost exprimate în mod semnificativ în mod diferențiat; și după 10 h, 41 de gene au fost exprimate în mod semnificativ în mod diferențiat (Fig. 7j; testul t al lui Student: P < 0,05). La fiecare punct de timp, mult mai multe gene au fost reglate în sus decât în jos (14 față de 6 la 1 h; 21 față de 6 la 5 h; și 34 față de 7 la 10 h). Printre aceste bZIP-uri exprimate diferențiat după tratamentul cu sare, multe dintre ele au fost distribuite în grupurile A și S (Fig. 7k), ceea ce indică faptul că bZIP-urile din aceste grupuri joacă roluri importante în semnalizarea zahărului și în reglarea stresului abiotic .
Grupul A bZIP posedă motive de fosforilare a situsului de fosforilare a protein-kinazei dependente de CKII și Ca2 + implicate în stres și/sau în semnalizarea ABA, iar aceste motive sunt importante pentru adaptarea plantelor la diverși factori de stres abiotici de mediu . Într-adevăr, multe gene din grupul A sunt asociate cu răspunsul la stresul salin. La Arabidopsis, ABI5 și ABFs/AREB sunt factori cheie de transducție a semnalului dependenți de ABA implicați în toleranța la stresul abiotic . Supraexprimarea lui GhABF2 a îmbunătățit semnificativ toleranța la stresul salin atât la Arabidopsis, cât și la bumbac . La tomate, slAREB1 și slbZIP1 knock-out au crescut toleranța la stresul salin, în timp ce supraexprimarea slAREB1 și slbZIP1 a redus toleranța la stresul salin . Aici, genele AdbZIP42 și AibZIP35 au fost reglate în mod semnificativ ca răspuns la stresul salin, iar aceste gene sunt omoloage cu ABFs, GhABF2, slAREB1 și slbZIP1. În plus, s-a raportat că aceste gene au fost fosforilate de proteinele kinaze SnRK2 activate de ABA , ceea ce sugerează că fosforilarea factorilor de legare a elementelor de răspuns ABA poate fi esențială pentru răspunsul la stresul salin mediat de ABA.
Genele grupului B AdbZIP45 și AibZIP40 au fost reglementate după 10 h de stres salin, iar aceste gene sunt omoloage cu AtbZIP17, ceea ce ar putea îmbunătăți expresia mai multor gene de răspuns la stresul salin în Arabidopsis . Șapte gene bZIP din grupul G bZIP (AdbZIP7, AdbZIP15, AdbZIP19, AdbZIP50, AibZIP17, AibZIP21 și AibZIP38) au fost omoloage cu AtbZIP41 din Arabidopsis și slbZIP38 din tomate, iar aceste gene s-au dovedit a regla negativ stresul salin . Dintre aceste șapte gene, AdbZIP15 a fost semnificativ reglată în jos după 1 h și 5 h de tratament cu stres salin, în timp ce AdbZIP19 și AibZIP17 au fost semnificativ reglate în sus după 10 h de stres salin. Astfel, AdbZIP15, AdbZIP19 și AibZIP17 ar putea conferi rezistență la stresul salin. AdbZIP15 ar putea fi un regulator negativ al stresului salin, deoarece modelul său de expresie a fost similar cu cel al slbZIP38 ca răspuns la stresul salin.
Genele grupului S AdbZIP24 și AdbZIP36 au fost omoloage cu AtbZIP1, AtbZIP53, MtbZIP2 și MtbZIP26, iar modelele de expresie ale acestor gene ca răspuns la stresul salin au fost similare (Fig. 7). În special, AdbZIP36 a fost reglată semnificativ după 10 h de stres salin. S-a demonstrat că două gene omologe din Arabidopsis, AtbZIP1 și AtbZIP53, reprogramează metabolismul primar al carbohidraților și aminoacizilor pentru a ajuta rădăcinile să se adapteze la stresul salin . Omologii MtbZIP2 și MtbZIP26 sunt, de asemenea, induși transcripțional de tratamentul cu sare și îmbunătățesc toleranța plantelor la stresul salin . În special, modelul de expresie al lui AdbZIP36 a fost similar cu cel al lui AtbZIP1, MtbZIP2 și MtbZIP26 în Arabidopsis și M. truncatula , sugerând că AdbZIP36 ar putea fi un regulator pozitiv al toleranței la stresul salin în arahide. În concluzie, studiul nostru de analiză a expresiei a identificat mai multe bZIP-uri candidate de arahide, care pot fi asociate cu răspunsul la stresul salin, ca ținte pentru cercetări viitoare.
.