Genome-wide systematisk karakterisering af bZIP transkriptionsfaktorer og deres ekspressionsprofiler under frøudvikling og som reaktion på saltstress i jordnødder
Identifikation, fylogenetisk analyse og gruppeklassificering af bZIP-gener i A. duranensis og A. ipaensis
Baseret på homologisøgninger og domæneverifikation blev der identificeret i alt 50 og 45 unikke bZIP-gener i henholdsvis A. duranensis og A. ipaensis genomer. Detaljerne for disse gener, herunder gen-ID, genomisk position, domænesammensætning og gruppeklassificering, er angivet i Additional file 1. I overensstemmelse med det eksisterende nomenklatursystem tildelte vi unikke navne til hvert af disse nye bZIP-gener: AdbZIP1-50 og AibZIP1-45. Efter kontrol af bZIP-domæner havde 93 gener et typisk bZIP-domæne, herunder et invariant N-× 7-R/K-motiv i basisregionen og en heptad gentagelse af Leu, der er placeret præcis ni aminosyrer opstrøms for R/K mod C-terminus (Yderligere fil 2). De resterende to bZIP-gener, AdbZIP28 og AibZIP22, havde en usædvanlig substitution i basisregionen: en udskiftning af det konserverede Arg/Lys (R/K) med IIe (I). Denne udskiftning er også blevet rapporteret i andre arter .
En systematisk undersøgelse af bZIP-genfamilien blev først foretaget i Arabidopsis . I denne analyse blev forskellige grupper af bZIP-gener skelnet og navngivet på grundlag af deres fylogenetiske relationer og funktionelle divergenser. Dette klassifikationssystem er siden blevet vedtaget for andre arter baseret på gruppering af bZIP-generne fra deres egne og Arabidopsis-genomer . Her, baseret på en maximum likelihood (ML)-analyse af bZIP-proteiner fra Arachis- og Arabidopsis-genomer, identificerede vi 11 forskellige bZIP-genklasser (grupper A-I, S og U), alle med høj bootstrap-støtte (Fig. 1). Undergruppeklassificeringen af Arachis bZIP’er blev yderligere bekræftet ved en fylogenetisk trærekonstruktion efter tilføjelse af bZIP’er fra sojabønne (Yderligere fil 3). De fleste bZIP-klasser omfatter nært beslægtede Arachis-bZIP’er og deres Arabidopsis-ortologer; klasser E og F har ingen tilsvarende medlemmer i A. duranensis eller A. ipaensis. Det er bemærkelsesværdigt, at bZIP-gener inden for den samme klade delte lignende gruppespecifikke sekvenskarakteristika, herunder exon/intron-struktur, intron-faser, MEME-motiver og forudsigelse af bindingsstedets struktur (yderligere analyseret nedenfor). Dette mønster af interspecifik gruppeklynge tyder på, at de gruppespecifikke egenskaber opstod før divergensen mellem Arachis og Arabidopsis. Der er imidlertid også akkumuleret adskillige forskelle i de forskellige plantearters bZIP-gener i løbet af den evolutionære tid.
Genstruktur af Arachis bZIP gener
Som intron og exon organisation kan indikere den evolutionære bZIP-geners udviklingsbane , undersøgte vi strukturen af Arachis bZIP gener, herunder intron antal, længde og splejsning fase (Yderligere fil 4). Vi fandt, at de overordnede genstrukturer var identiske eller lignende for Arachis bZIP’er inden for samme fylogenetiske gruppe. I betragtning af antallet af introner i jordnødde bZIP’er var 24% af AdbZIP’erne og 22% af AibZIP’erne intronløse, hvilket udelukkende forekommer i gruppe S og B. Blandt de intronholdige gener varierede antallet af introner fra 1 til 13 i AdbZIP- og AibZIP-gener. bZIP-gener i gruppe G havde flest introner, hvilket er i overensstemmelse med observationer i andre bælgplantegenomer .
Splejsningsfaserne blev betegnet som tre splejsefaser: fase 0 (P0), splejsning fandt sted efter kodonets tredje nukleotid; fase 1 (P1), splejsning fandt sted efter kodonets første nukleotid; og fase 2 (P2), splejsning fandt sted efter det andet nukleotid. Faserne af splejsningspladserne inden for de åbne læserammer (ORF’er) var forskellige, men var stærkt bevaret i bZIP-domænets basis- og hængselsregioner, fordi enhver ændring i disse regioner ville påvirke deres kode og funktion. På grundlag af intronpositionen og tilstedeværelsen eller antallet af splejsningfaser i bZIP-domænet blev der identificeret fire intronmønstre (a til d) i Arachis bZIP-generne (Fig. 2 og Additional file 2). Mønster a havde kun ét intron indsat ved – 5 positionen i hinge-regionen mellem aminosyrerne Gln og Ala; dette mønster blev identificeret i alle Arachis bZIP-gener i gruppe A og G. Mønster b havde to intronindsættelser med fase 0, den ene i basisregionen og den anden i hinge-regionen; dette mønster blev identificeret i alle bZIP-gener i gruppe D. Mønster c havde et enkelt intron indsat ved – 20-positionen i basisregionen i fase 2 (P2) og indeholder alle bZIP-gener i gruppe C og H. Mønster d manglede introner i basis- og hængselsregionen og omfatter alle bZIP-gener i gruppe B og S. Desuden var de fleste Arachis bZIP’er med mønster d intronløse, undtagen AdbZIP45 og AibZIP40. Hver af disse gener havde en intron uden for basis- og hængsleregionerne. De mønstre af splejsning fase i Arachis bZIP domæne observeret her var i overensstemmelse med dem, der er observeret i andre arter . Den høje bevarelse af genstruktur og intronfaser inden for fylogenetiske klasser understøttede den accepterede gruppeklassifikation og antydede, at disse forskellige mønstre af exonsplejning kan spille en vigtig rolle i den funktionelle evolution.
Motivsammensætningerne for forskellige grupper af Arachis bZIP’er
Ud over bZIP-domænet blev mange yderligere konserverede motiver påvist i bZIP-generne ved hjælp af MEME-analyseværktøjet. Som vist i fig. 3 blev der identificeret i alt 18 bevarede motiver uden for bZIP-domænet, og konsensusmotivsammensætningerne for hver undergruppe blev konstrueret (Yderligere fil 5). Disse konsensusmotiver viste, at de overordnede sammensætninger af motiverne var ens inden for den samme undergruppe, men forskellige mellem forskellige grupper. Dette tydede på, at funktionel divergens af bZIP-generne kan være bestemt af gruppespecifikke motiver. Individuel undersøgelse af disse motiver viste, at mange af dem var gruppespecifikke. F.eks. blev motiv 1, 2, 3 og 10 kun identificeret i gruppe D; motiv 5, 14 og 15 blev kun identificeret i gruppe G; motiv 6 blev kun identificeret i gruppe I; og motiv 9 blev kun identificeret i gruppe H. Flere motiver kan være forbundet med specifikke biologiske funktioner. F.eks. er motiv 1 DOG 1-domænet (DELAY OF GERMINATION) 1, som er nødvendigt for induktion af hviletid og flere aspekter af frømodning, til dels ved at forstyrre ABA-signaleringskomponenter . Motiv 3 indeholder potentielle caseinkin kinase II (CK II)-fosforyleringssteder (S/TxxD/E), som spiller en nøglerolle i celledeling og ekspansion og påvirker forskellige udviklings- og stressresponsive veje . Interessant nok er disse gruppespecifikke motiver også blevet identificeret i bZIP’er fra samme gruppe i andre bælgplantegenomer , hvilket tyder på, at motivsammensætningen er bevaret på tværs af bælgplanter.
Arachis bZIP DNA-bindingsstedets struktur og dimeriseringsegenskaber
Den grundlæggende kerneregion og bZIP-domænets hængselregion bestemmer uafhængigt af hinanden DNA-bindingsspecificiteten, hvilket er påvist ved flere eksperimenter . Den usædvanlige udskiftning af de to invariante steder, asparagin (Asn/N; position: – 18) og arginin (Arg/R; position: – 10), ændrede DNA-bindingsspecificiteterne . Vi tilpassede aminosyresekvenserne af de grundlæggende og hængselsregioner af jordnødde bZIP-proteiner for at identificere konserverede og polymorfe aminosyrerester inden for hver gruppe (Additional file 6). Der blev ikke observeret nogen udskiftninger af Asn/N ved – 18-positionen i nogen jordnødde bZIP’er. Alle medlemmer af gruppe I havde imidlertid lysin (Lys/K) i stedet for arginin (R) i positionen – 10, hvilket er i overensstemmelse med gruppe I bZIP’er fra andre bælgplantearter . Desuden havde AdbZIP28 og AibZIP22 (gruppe U) en hydrofob isoleucin (Ile/I) rest i stedet for en arginin (Arg/R), og det blev påvist, at en sådan udskiftning fuldstændig hæmmer bZIP’s affinitet for AP1 i gær og ikke genkender G-bokse i ris .
Lu-zipper-sekvensen medierer homo- og/eller heterodimerisering af bZIP-proteiner, som er kendt for at binde til DNA som dimerer . Leu zipper regionen består af heptad gentagelser, aminosyrerne er refereret til a, b, c, d, e, f, og g inden for hver heptad . Da aminosyrerne på a-, d-, e- og g-positionerne befinder sig nær Leu zipper-grænsefladen, er det disse aminosyrer, der primært bestemmer Leu zipper-oligomerisering, dimeriseringsstabilitet og dimerspecificitet. Vi analyserede sammensætningerne af de aminosyrer, der findes ved a-, d-, e- og g-positionerne i jordnødde bZIP’er (Fig. 4a).
I a-positionen, var ca. 20 % af resterne asparagin (Asn/N), som kan danne en polær lomme i den hydrofobiske grænseflade, hvilket giver mulighed for mere stabile N-N-interaktioner ved a↔a′ (den tilsvarende position i den modsatte helix) i forhold til andre aminosyrer . På tværs af de forskellige heptads havde den anden og den femte heptads den højeste frekvens af Asn/N-rester i a-positionen (henholdsvis 61,46 og 60,22 %; fig. 4b). I d-positionen (Fig. 4a) blev Leu fundet i 45 % af alle jordnødde bZIP’er og er en af de mest dimer-stabiliserende alifatiske aminosyrer . Ved e-positionen havde 37 % af alle jordnødde bZIP’er de sure aminosyrer D eller E, mens 44 % af alle jordnødde bZIP’er ved g-positionen havde de basiske aminosyrer R eller K (Fig. 4a). Disse ladede aminosyrer menes at danne saltbroer mellem helikserne i elektrostatiske interaktioner . De attraktive eller frastødende g↔e′ elektrostatiske interaktioner kan også danne saltbroer mellem helikale saltbroer, der påvirker dimeriseringsspecificitet og stabilitet . For at undersøge bidraget fra ladede rester på e og g positioner i styrende dimeriseringsegenskaber af Arachis bZIP proteiner, blev frekvenserne af attraktive og repulsive g↔e′ par i hver heptad beregnet (Fig. 4c). På tværs af alle heptads var de attraktive g↔e′-par koncentreret i den anden (15,6 %), femte (35 %) og sjette (30 %) heptads, hvilket indikerer, at de kan danne fuldstændige attraktive g↔e′-interaktioner og bidrage til stabilitet gennem komplementering i en heterodimer. Tre grupper, der omfatter 28 underfamilier (BZ1-BZ28), blev yderligere opdelt baseret på homo- og heterodimeriseringsegenskaber, især dimeriseringsspecificitet (Yderligere fil 7).
Indvirkningen af helgenomduplikation og tandemduplikation på ekspansionen af Arachis bZIP-genfamilien
Vi identificerede de kollineære duplikerede blokke i hele genomet i A. duranensis- og A. ipaensis-genomerne og de ortologt kollineære blokke mellem to genomer. De parvise synonyme afstande (Ks-værdier) mellem de paraloge og ortologer inden for kollineære blokke blev beregnet, og deres frekvensfordelinger blev plottet (Fig. 5a; Ks bin = 0,05). Den højeste Ks-frekvens mellem A. duranensis og A. ipaensis, der repræsenterer den gennemsnitlige sekvensvariation, var 0,035. Dette repræsenterede sekvensdivergensen mellem disse to nært beslægtede Arachis-arter, som blev anslået til at have divergeret for ~ 2,16 millioner år siden . Endvidere var Ks-toppene for A. duranensis og A. ipaensis paraloger henholdsvis 0,90 og 0,95, svarende til sekvensdivergensen af tidlig papilionoid helgenomduplikation (WGD) begivenhed fandt sted ~ 58 millioner år siden .
Vi påviste 35 AdbZIP’er og 32 AibZIP’er involveret i duplikerede genomiske blokke, der tegner sig for omkring 70 % (35/50) og 71 % (32/45) af bZIP generne i hver art (Fig. 5b og Additional file 8). Desuden optrådte de duplikerede bZIP-genpar enten inden for et kromosom eller mellem kromosomer, og nogle af disse par var segmentvis duplikeret en, to eller tre gange. Dette resultat tyder på, at genet fortrinsvis blev bevaret og hyppige kromosomale arrangementer efter WGD. Tandemduplikeringer blev kun påvist for to genpar (AdbZIP33/AdbZIP34 og AdbZIP41/AdbZIP42) i A. duranensis og kun for et enkelt genpar (AibZIP28/AibZIP29) i A. ipaensis. Dette tyder på, at tandemduplikation sjældent forekommer og ikke er vigtigere end segmental duplikation i udvidelsen af bZIP-genfamilien. Vi brugte også fylogenetiske og synteniske analyser til at identificere 35 ortologt bZIP-genpar mellem A. duranensis og A. ipaensis. Disse gener var også homøologer mellem de to subgenomer af den tetraploide jordnøddeart.
For at forstå de evolutionære begrænsninger, der virker på Arachis bZIP-generne, beregnede vi Ka/Ks værdier for hvert duplikeret bZIP-genpar i to Arachis-arter (Yderligere fil 9). For de fleste af disse parvise sammenligninger var Ka/Ks-værdierne mindre end 0,5 (kun én parvis sammenligning mellem duplikerede AdbZIP’er og kun to mellem duplikerede AibZIP’er var større end 0,5). Dette tyder på, at stærk rensende selektion virkede på Arachis-duplikerede bZIP’er for at fjerne skadelige mutationer på proteinniveau.
Ekspressionsanalyse af Arachis bZIP-gener under jordnøddefrøudvikling
For at profilere bZIP-genekspressionen brugte vi vores tidligere offentliggjorte RNA-seq-data , som dokumenterer genekspression i jordnøddefrø på forskellige udviklingsstadier: 20, 40 og 60 dage efter blomstring (DAF). Ved hjælp af disse data identificerede vi FPKM-værdierne for alle Arachis bZIP’er og alle differentielt udtrykte bZIP’er på tværs af de tre udviklingsstadier. Med undtagelse af 24 bZIP’er, som ikke blev udtrykt på noget udviklingsstadium, blev der genkendt fire grupper, herunder tilsvarende bZIP-gener med en specifik ekspressionsprofil (Fig. 6a og Additional file 10). Den første gruppe bestod af 37 bZIP’er, der var opreguleret i den tidlige udvikling (20 DAF), men nedreguleret derefter (ved 40 og 60 DAF). Den anden gruppe bestod af 15 bZIP’er, der blev opreguleret ved 40 DAF, mens den tredje gruppe bestod af 17 bZIP’er, der blev nedreguleret ved 40 DAF. Den fjerde gruppe bestod af 22 bZIP’er, der blev udtrykt i høj grad på tværs af alle tre udviklingsstadier. De højt udtrykte bZIP’er i gruppe fire var hovedsageligt fordelt i kladerne A, C og S. Flere af disse bZIP’er var homologe med gener, der er blevet inddraget i frøudviklingen hos andre planter, såsom Arabidopsis , ris og majs . Her blev 12 bZIP’er, som var stærkt udtrykt og homologe med tidligere velundersøgte gener i frøudvikling, udvalgt til qRT-PCR-konfirmation, og det blev konstateret, at ekspressionsmønstrene bestemt ved RNA-seq var i overensstemmelse med dem, der blev fundet ved hjælp af qRT-PCR (Fig. 6b).
I gruppe A var AdbZIP33 og AibZIP28 ortologer til Arabidopsis ABA insensitive 5 (ABI5), som er forbundet med ABA-signalering samt regulering af frøudvikling og levetid i Arabidopsis og bælgplanter . Vores RNA-seq- og qRT-PCR-resultater viste, at begge ortologt ABI5-kopier fra de to undergenomer af den tetraploide jordnødde blev stærkt udtrykt under udviklingen, hvilket tyder på, at funktionen af disse gener kan være den samme i jordnødder og Arabidopsis. Vores qRT-PCR-resultater viste også, at gruppe A-generne AdbZIP42, AdbZIP48 og AibZIP31 blev stabilt udtrykt i løbet af udviklingen (Fig. 6b og Additional file 11). Disse gener er homologe med ABF’er og AREB, som er involveret i ABA-medieret frøudvikling, spiring og embryomodning . Tre gener i gruppe C (AdbZIP23, AdbZIP37 og AibZIP30) blev også udtrykt i høj grad og er homologe med majsens bZIP-faktor Opaque2. Opaque2 regulerer proteinakkumulering og aminosyre- og sukkermetabolisme i majsfrø . Desuden var gruppe S-generne AibZIP10, AdbZIP12, AdbZIP24, AdbZIP26 og AdbZIP36 ekstremt stærkt udtrykt i jordnøddefrø (fig. 6b og Additional file 11). Interessant nok havde gruppe S-generne AdbZIP24 og AdbZIP36 et lignende ekspressionsmønster som gruppe C-generne AdbZIP37 og AibZIP30: et fald i ekspressionsniveauet, efterhånden som frøudviklingen skred frem.
Vi undersøgte derefter yderligere divergenserne i genekspression mellem homøologer fra AA- og BB-generne i den tetraploide jordnødde. Heatmap-analysen viste, at de overordnede ekspressionsmønstre på tværs af frøudviklingen var ens for 31 par af homøologe/ortologe gener fra AA- og BB-generne. Vi anvendte differentiel ekspressionsanalysemetoden i kombination med statistiske metoder til at beregne forskelle i genekspression mellem disse genpar for hver prøve. Vi fandt, at 3 par af gener (AdbZIP5 og AibZIP5, AdbZIP17 og AibZIP15, AdbZIP46 og AibZIP41) blev differentielt udtrykt ved 20 DAF, 3 par (AdbZIP3 og AibZIP1, AdbZIP4 og AibZIP4, AdbZIP49 og AibZIP45) ved 40 DAF, og 5 par (AdbZIP3 og AibZIP1, AdbZIP33 og AibZIP28, AdbZIP37 og AibZIP30, AdbZIP10 og AibZIP10, AdbZIP1 og AibZIP3) ved 60 DAF. Disse resultater indikerede den overordnede ekspressionsbevaring mellem to genomer, men antydede, at 20% af generne havde divergeret i ekspression under den parallelle evolution og polyploidisering af to genomer (Fig. 6c).
qRT-PCR-ekspressionsprofiler af Arachis bZIP-gener under saltstress
Vi brugte qRT-PCR til at undersøge ændringer i bZIP-genekspression som reaktion på saltbehandling (Fig. 7 og Additional file 12). Vi var ikke i stand til klart at amplificere 4 bZIP’er med PCR. Efter at jordnødderødderødder blev behandlet med salt i 1 time, blev 20 gener signifikant differentielt udtrykt; efter 5 timer blev 27 gener signifikant differentielt udtrykt; og efter 10 timer blev 41 gener signifikant differentielt udtrykt (Fig. 7j; Student’s t-test: P < 0,05). På hvert tidspunkt blev mange flere gener opreguleret end nedreguleret (14 vs. 6 efter 1 h; 21 vs. 6 efter 5 h; og 34 vs. 7 efter 10 h). Blandt disse differentielt udtrykte bZIP’er efter saltbehandling var mange af dem fordelt i gruppe A og S (Fig. 7k), hvilket indikerer, at bZIP’er i disse grupper spiller vigtige roller i sukker-signalering og abiotisk stressregulering .
Gruppe A bZIP’er besidder CKII- og Ca2 + -afhængige proteinkinase-fosforyleringsstedmotiver, der er involveret i stress- og/eller ABA-signalering, og disse motiver er vigtige for planters tilpasning til forskellige abiotiske miljøstressorer . Mange gruppe A-gener er faktisk forbundet med saltstressrespons. I Arabidopsis er ABI5 og ABFs/AREB vigtige ABA-afhængige signaltransduktionsfaktorer, der er involveret i abiotisk stresstolerance . Overekspression af GhABF2 forbedrede saltstresttolerancen betydeligt både i Arabidopsis og bomuld . I tomat øgede slAREB1 og slbZIP1 knockout saltstresttolerance, mens slAREB1 og slbZIP1 overekspression reducerede saltstresttolerance . Her blev generne AdbZIP42 og AibZIP35 signifikant opreguleret som reaktion på saltstress, og disse gener er homologe med ABF’er, GhABF2, slAREB1 og slbZIP1. Desuden er disse gener blevet rapporteret til at blive fosforyleret af de ABA-aktiverede SnRK2-proteinkinaser , hvilket tyder på, at fosforylering af ABA-responselement-bindingsfaktorer kan være kritisk for den ABA-medierede saltstressrespons.
Gruppe B-generne AdbZIP45 og AibZIP40 blev opreguleret efter 10 timers saltstress, og disse gener er homologe med AtbZIP17, hvilket kunne forbedre ekspressionen af flere saltstressresponsgener i Arabidopsis. Syv gruppe G bZIP-gener (AdbZIP7, AdbZIP15, AdbZIP19, AdbZIP50, AibZIP17, AibZIP21 og AibZIP38) var homologe med Arabidopsis AtbZIP41 og tomat slbZIP38, og disse gener er begge blevet vist at regulere saltstress negativt . Af disse syv gener blev AdbZIP15 signifikant nedreguleret efter 1 times og 5 timers saltstressbehandling, mens AdbZIP19 og AibZIP17 blev signifikant opreguleret efter 10 timers saltstress. AdbZIP15, AdbZIP19 og AibZIP17 kan således give modstandsdygtighed over for saltstress. AdbZIP15 kan være en negativ regulator af saltstress, da dets ekspressionsmønster lignede slbZIP38’s som reaktion på saltstress.
Gruppe S-generne AdbZIP24 og AdbZIP36 var homologe med AtbZIP1, AtbZIP53, MtbZIP2 og MtbZIP26, og ekspressionsmønstrene for disse gener som reaktion på saltstress var ens (fig. 7). Især AdbZIP36 blev signifikant opreguleret efter 10 timers saltstress. To homologe gener i Arabidopsis, AtbZIP1 og AtbZIP53, blev vist at omprogrammere det primære kulhydrat- og aminosyremetabolisme for at hjælpe rødderne med at tilpasse sig til saltstress . De homologe MtbZIP2 og MtbZIP26 er også transkriptionelt induceret af saltbehandling og forbedrer plantens tolerance over for saltstress . Især var ekspressionsmønsteret af AdbZIP36 magen til dem af AtbZIP1, MtbZIP2 og MtbZIP26 i Arabidopsis og M. truncatula , hvilket tyder på, at AdbZIP36 kan være en positiv regulator af tolerance over for saltstress i jordnødder. Sammenfattende har vores undersøgelse af ekspressionsanalyse identificeret flere kandidat bZIP’er i jordnødder, som kan være forbundet med saltstressrespons, som mål for fremtidig forskning.