Genome-wide systematic characterization of bZIP transcription factors and their expression profiles during seed development and in response to salt stress in peanut
Identificatie, fylogenetische analyse en groepsindeling van bZIP-genen in A. duranensis en A. ipaensis
Gebaseerd op homologie-zoekopdrachten en domein-verificatie werden in totaal 50 en 45 unieke bZIP-genen geïdentificeerd in respectievelijk de genomen van A. duranensis en A. ipaensis. De details voor deze genen, inclusief gen ID, genomische positie, domeinsamenstelling, en groep classificatie worden gegeven in Additioneel bestand 1. Volgens het bestaande nomenclatuursysteem hebben we unieke namen toegekend aan elk van deze nieuwe bZIP-genen: AdbZIP1-50 en AibZIP1-45. Na controle van de bZIP domeinen, hadden 93 genen een typisch bZIP domein, inclusief een invariant N-× 7-R/K motief in de basisregio en een heptad herhaling van Leu precies negen aminozuren stroomopwaarts van R/K in de richting van de C terminus (Additional file 2). De overige twee bZIP-genen, AdbZIP28 en AibZIP22, hadden een ongebruikelijke substitutie in de basisregio: een vervanging van de geconserveerde Arg/Lys (R/K) door IIe (I). Deze vervanging is ook bij andere soorten gemeld.
Een systematisch onderzoek van de bZIP-genfamilie werd voor het eerst uitgevoerd in Arabidopsis . Bij deze analyse werden verschillende groepen bZIP-genen onderscheiden en benoemd op basis van hun fylogenetische verwantschap en functionele divergenties. Dit classificatiesysteem is sindsdien overgenomen voor andere soorten op basis van de clustering van bZIP-genen uit hun eigen genoom en dat van Arabidopsis. Hier, op basis van een maximale waarschijnlijkheid (ML) analyse van bZIP-eiwitten uit Arachis en Arabidopsis genomen, identificeerden we 11 verschillende bZIP-gen clades (groepen A-I, S, en U), alle met een hoge bootstrap ondersteuning (Fig. 1). De subgroep indeling van Arachis bZIPs werd verder bevestigd door fylogenetische boomreconstructie na het toevoegen van bZIPs van soja (Additional file 3). De meeste bZIP clades omvatten nauw verwante Arachis bZIPs en hun Arabidopsis orthologen; clades E en F hebben geen overeenkomstige leden in A. duranensis of A. ipaensis. Opmerkelijk is dat bZIP genen binnen dezelfde clade vergelijkbare groep-specifieke sequentie kenmerken deelden, met inbegrip van exon/intron structuur, intron fasen, MEME motieven, en voorspelling van bindende site structuur (hieronder verder geanalyseerd). Dit patroon van interspecifieke groep clustering suggereert dat de groep-specifieke kenmerken ontstonden voorafgaand aan de divergentie van Arachis en Arabidopsis. Toch zijn er in de loop van de evolutie ook diverse verschillen ontstaan in de bZIP-genen van de verschillende plantensoorten.
Genstructuur van Arachis bZIP-genen
Omdat intron- en exonorganisatie het evolutionaire traject van bZIP-genen zou kunnen aangeven, onderzochten we de structuur van Arachis bZIP-genen, inclusief intronaantal, lengte en splicingfase (aanvullend bestand 4). We vonden dat de totale gen structuren waren identiek of vergelijkbaar voor Arachis bZIPs binnen dezelfde fylogenetische groep. Gezien het aantal introns van pinda bZIPs, 24% van AdbZIPs en 22% van AibZIPs waren intronless, die uitsluitend in groepen S en B. Onder de intron-bevattende genen, het aantal introns varieerde van 1 tot 13 in AdbZIP en AibZIP genen. bZIP genen in groep G had de meeste introns, in overeenstemming met waarnemingen in andere peulvruchten genomen.
De splicing fasen werden aangeduid als drie splicing fasen: fase 0 (P0), splicing vond plaats na de derde nucleotide van het codon; fase 1 (P1), splicing vond plaats na de eerste nucleotide van het codon; en fase 2 (P2), splicing vond plaats na de tweede nucleotide. De fasen van de splicing sites binnen de open reading frames (ORFs) waren divers, maar waren zeer geconserveerd in de basis en scharnier regio’s van het bZIP domein, omdat veranderingen in deze regio’s hun code en functie zouden beïnvloeden. Op basis van intron positie en aanwezigheid of aantal splicing fasen in het bZIP domein, werden vier intron patronen (a tot d) in Arachis bZIP genen geïdentificeerd (Fig. 2 en Additional file 2). Patroon a had slechts een intron ingevoegd op de – 5 positie van het scharniergebied, tussen de aminozuren Gln en Ala, dit patroon werd geïdentificeerd in alle Arachis bZIP-genen in de groepen A en G. Patroon b had twee intron inserties met fase 0, een in de basisregio en de andere in het scharniergebied, dit patroon werd geïdentificeerd in alle bZIP genen in groep D. Patroon c had een enkel intron ingevoegd op de – 20 positie in de basisregio in fase 2 (P2), en omvat alle bZIP-genen in de groepen C en H. Patroon d had geen introns in de basis- en scharnierregio, en omvat alle bZIP-genen in de groepen B en S. Bovendien waren de meeste Arachis bZIP’s met patroon d intronloos, behalve AdbZIP45 en AibZIP40. Elk van deze genen had één intron buiten de basis- en scharnierregio’s. De patronen van splicing fase in Arachis bZIP domein hier waargenomen waren consistent met die waargenomen in andere soorten . Het hoge behoud van genstructuur en intronfasen binnen fylogenetische clades ondersteunde de aanvaarde groepsindeling, en suggereerde dat deze verschillende patronen van exon splicing een belangrijke rol kunnen spelen in de functionele evolutie.
De motief composities voor verschillende groepen van Arachis bZIPs
Naast het bZIP-domein, werden veel extra geconserveerde motieven gedetecteerd in bZIP-genen door de MEME-analyse-instrument. Zoals te zien in Fig. 3, werden in totaal 18 geconserveerde motieven buiten het bZIP domein geïdentificeerd, en de consensus motief composities voor elke subgroep werden geconstrueerd (Additional file 5). Deze consensus motieven gaven aan dat de algemene samenstelling van de motieven vergelijkbaar was binnen dezelfde subgroep, maar verschillend tussen de verschillende groepen. Dit suggereerde dat functionele divergentie van bZIP genen bepaald kan worden door groep-specifieke motieven. Individueel onderzoek van deze motieven wees uit dat vele groepsspecifiek waren. Zo werden de motieven 1, 2, 3 en 10 alleen in groep D geïdentificeerd; de motieven 5, 14 en 15 alleen in groep G; motief 6 alleen in groep I; en motief 9 alleen in groep H. Verscheidene motieven kunnen met specifieke biologische functies geassocieerd zijn. Motief 1 bijvoorbeeld is het DELAY OF GERMINATION (DOG) 1 domein, dat nodig is voor de inductie van dormantie en meerdere aspecten van zaadrijping, gedeeltelijk door interferentie met ABA signaalcomponenten. Motief 3 bevat potentiële caseïnekinase II (CK II) fosforyleringsplaatsen (S/TxxD/E), die een sleutelrol spelen bij de celdeling en -uitbreiding en van invloed zijn op diverse ontwikkelings- en stressresponsieve paden. Interessant is dat deze groep-specifieke motieven ook zijn geïdentificeerd in bZIPs van dezelfde groep in andere peulvruchten-genomen , wat suggereert dat de samenstelling van motieven geconserveerd is in peulvruchten-planten.
Arachis bZIP DNA-binding-site structuur en dimerisatie-eigenschappen
De kern-basisregio en de scharnierregio van het bZIP-domein bepalen onafhankelijk van elkaar de DNA-binding specificiteit, zoals aangetoond door verschillende experimenten . De ongebruikelijke vervanging van de twee invariante plaatsen, asparagine (Asn/N; positie: – 18) en arginine (Arg/R; positie: – 10), veranderde de DNA-bindende specificiteit. We hebben de aminozuursequenties van de basis- en scharnierregio’s van pinda bZIP-eiwitten uitgelijnd om geconserveerde en polymorfe aminozuurresiduen binnen elke groep te identificeren (Additional file 6). Er werden geen vervangingen van Asn/N op de – 18 positie waargenomen in pinda bZIPs. Alle leden van groep I hadden echter lysine (Lys/K) in plaats van arginine (R) op de – 10 positie, consistent met de groep I bZIPs van andere peulvruchtensoorten. Bovendien hadden AdbZIP28 en AibZIP22 (groep U) een hydrofoob isoleucine (Ile/I) residu in plaats van een arginine (Arg/R), en van een dergelijke vervanging werd aangetoond dat het de affiniteit van bZIP voor AP1 in gist volledig remt en G-boxen in rijst niet herkent.
De Leu-ritssequentie medieert de homo- en/of heterodimerisatie van bZIP-eiwitten, waarvan bekend is dat ze zich als dimeren aan DNA binden. De Leu zipper regio bestaat uit heptad herhalingen, de aminozuren worden aangeduid met a, b, c, d, e, f, en g binnen elke heptad . Aangezien de aminozuren op de a, d, e en g posities zich dicht bij de Leu zipper interface bevinden, zijn deze aminozuren degenen die voornamelijk de oligomerisatie van de Leu zipper, de stabiliteit van de dimerisatie en de specificiteit van het dimeer bepalen. We analyseerden de samenstelling van de aminozuren op de a, d, e en g posities van pinda bZIPs (Fig. 4a).
Op de a-positie, was ongeveer 20% van de residuen asparagine (Asn/N), dat een polaire zak in de hydrofobe interface kan vormen, waardoor stabielere N-N interacties mogelijk zijn op a↔a′ (de corresponderende positie in de tegenovergestelde helix), in vergelijking met andere aminozuren. Over de verschillende heptaden heen hadden de tweede en de vijfde heptaat de hoogste frequentie van Asn/N-residuen op de a-positie (61,46 en 60,22%, respectievelijk; Fig. 4b). Op de d-positie (Fig. 4a) werd Leu gevonden in 45% van alle pinda bZIPs en is een van de meest dimerstabiliserende alifatische aminozuren. Op de e positie had 37% van alle pinda bZIP’s de zure aminozuren D of E, terwijl op de g positie 44% van alle pinda bZIP’s de basische aminozuren R of K had (Fig. 4a). Van deze geladen aminozuren wordt verondersteld dat ze zoutbruggen vormen tussen de helices in elektrostatische interacties. De aantrekkelijke of afstotende g↔e′ elektrostatische interacties kunnen ook interhelicale zoutbruggen vormen die de dimerisatie specificiteit en stabiliteit beïnvloeden. Om de bijdrage van geladen residuen op de e en g posities in het beheersen van dimerisatie-eigenschappen van Arachis bZIP-eiwitten te onderzoeken, werden de frequenties van aantrekkelijke en afstotende g↔e′ paren in elke heptad berekend (Fig. 4c). Over alle heptaden waren de aantrekkelijke g↔e′-paren geconcentreerd in de tweede (15,6%), vijfde (35%) en zesde (30%) heptaden, wat aangeeft dat ze volledige aantrekkelijke g↔e′-interacties kunnen vormen en bijdragen aan de stabiliteit door complementatie in een heterodimeer. Drie groepen bestaande uit 28 subfamilies (BZ1-BZ28) werden verder onderverdeeld op basis van homo- en heterodimerisatie-eigenschappen, met name dimerisatiespecificiteit (Additional file 7).
De impact van genoomwijde duplicatie en tandemduplicatie op de uitbreiding van Arachis bZIP-genfamilie
We identificeerden de genoomwijde collineair gedupliceerde blokken in de A. duranensis en A. ipaensis-genomen en de orthologe collineaire blokken tussen twee genomen. De paarsgewijze synonieme afstanden (Ks waarden) tussen de paraloga en orthologs binnen collineaire blokken werden berekend, en hun frequentieverdelingen werden uitgezet (Fig. 5a; Ks bin = 0.05). De piek Ks frequentie tussen A. duranensis en A. ipaensis, die de gemiddelde sequentie variatie vertegenwoordigt, was 0.035. Dit vertegenwoordigt de sequentie divergentie tussen deze twee nauw verwante Arachis soorten, die naar schatting ~ 2,16 miljoen jaar geleden zijn gedivergeerd. Verder, de Ks pieken voor A. duranensis en A. ipaensis paralogs waren 0,90 en 0,95, respectievelijk, wat overeenkomt met de sequentie divergentie van vroege papilionoid hele genoom duplicatie (WGD) gebeurtenis vond ~ 58 miljoen jaar geleden .
We ontdekten 35 AdbZIPs en 32 AibZIPs die betrokken zijn bij gedupliceerde genomische blokken, goed voor ongeveer 70% (35/50) en 71% (32/45) van de bZIP genen in elke soort (Fig. 5b en Additional file 8). Bovendien kwamen de gedupliceerde bZIP-gen paren voor binnen een chromosoom of tussen chromosomen, en sommige van deze paren waren segmentaal één, twee, of drie keer gedupliceerd. Dit resultaat duidde op preferentiële genretentie en frequente chromosomale rangschikkingen na WGD. Tandemdubbelingen werden slechts voor twee genparen (AdbZIP33/AdbZIP34 en AdbZIP41/AdbZIP42) in A. duranensis en slechts één genpaar (AibZIP28/AibZIP29) in A. ipaensis gedetecteerd. Dit suggereert dat tandem duplicatie zelden voorkwam en niet belangrijker was dan segmentale duplicatie in de uitbreiding van de bZIP genfamilie. Wij gebruikten ook fylogenetische en syntenische analyses om 35 orthologe bZIP genparen tussen A. duranensis en A. ipaensis te identificeren. Deze genen waren ook homeologs tussen de twee subgenomen van de tetraploïde pinda.
Om de evolutionaire beperkingen op de Arachis bZIP genen te begrijpen, berekenden we Ka/Ks waarden voor elk gedupliceerd bZIP genpaar in twee Arachis soorten (Additional file 9). Voor de meeste van deze paarsgewijze vergelijkingen, de Ka / Ks waarden waren minder dan 0,5 (slechts een paarsgewijze vergelijking tussen gedupliceerde AdbZIPs en slechts twee tussen gedupliceerde AibZIPs waren groter dan 0,5). Dit suggereert dat sterke zuiverende selectie heeft gewerkt op de Arachis gedupliceerde bZIPs om schadelijke mutaties op eiwitniveau te verwijderen.
Expressieanalyse van Arachis bZIP-genen tijdens de ontwikkeling van pindazaad
Om bZIP-genexpressie te profileren, gebruikten we onze eerder gepubliceerde RNA-seq gegevens , die genexpressie documenteren in pindazaden in verschillende ontwikkelingsstadia: 20, 40, en 60 dagen na de bloei (DAF). Met behulp van deze gegevens, identificeerden we de FPKM waarden voor alle Arachis bZIPs en alle differentieel tot expressie gebrachte bZIPs over de drie ontwikkelingsstadia. Met uitzondering van 24 bZIPs, die niet werden uitgedrukt in een ontwikkelingsstadium, vier groepen met inbegrip van overeenkomstige bZIP genen met specifieke expressie profiel werden herkend (Fig. 6a en Additional file 10). De eerste groep bestond uit 37 bZIPs die tijdens de vroege ontwikkeling (20 DAF) tot expressie kwamen, maar daarna (bij 40 en 60 DAF) werden gedownreguleerd. De tweede groep bestond uit 15 bZIPs die werden up-gereguleerd bij 40 DAF, terwijl de derde groep bestond uit 17 bZIPs die werden down-gereguleerd bij 40 DAF. De vierde groep bestond uit 22 bZIPs die in alle drie de ontwikkelingsstadia sterk tot expressie kwamen. De sterk geëxpresseerde bZIPs in groep vier waren hoofdzakelijk verdeeld over de clades A, C en S. Verscheidene van deze bZIPs waren homoloog met genen die betrokken zijn bij de zaadontwikkeling in andere planten, zoals Arabidopsis, rijst en maïs. Hier werden 12 bZIPs, die sterk tot expressie kwamen en homoloog waren met eerdere goed bestudeerde genen in de zaadontwikkeling, geselecteerd voor qRT-PCR bevestiging, en vonden dat de expressiepatronen bepaald door RNA-seq consistent waren met die gevonden met behulp van qRT-PCR (Fig. 6b).
In groep A waren AdbZIP33 en AibZIP28 ortholoog aan Arabidopsis ABA insensitive 5 (ABI5), dat betrokken is bij ABA-signalering en de regulering van zaadontwikkeling en levensduur in Arabidopsis en peulvruchten. Onze RNA-seq en qRT-PCR resultaten toonden aan dat beide orthologe ABI5 kopieën van de twee subgenomen van de tetraploïde pinda sterk tot expressie kwamen tijdens de ontwikkeling, wat suggereert dat de functie van deze genen vergelijkbaar zou kunnen zijn in pinda en Arabidopsis. Onze qRT-PCR resultaten toonden ook aan dat de groep A genen AdbZIP42, AdbZIP48 en AibZIP31 stabiel tot expressie kwamen tijdens de ontwikkeling (Fig. 6b en Additional file 11). Deze genen zijn homoloog aan ABFs en AREB, die betrokken zijn bij ABA-gemedieerde zaadontwikkeling, kieming, en embryo rijping. Drie genen in groep C (AdbZIP23, AdbZIP37, en AibZIP30) kwamen ook sterk tot expressie, en zijn homoloog met de maïs bZIP factor Opaque2. Opaque2 reguleert de accumulatie van eiwitten en het aminozuur- en suikermetabolisme in maïszaden. Bovendien kwamen de groep S genen AibZIP10, AdbZIP12, AdbZIP24, AdbZIP26, en AdbZIP36 zeer sterk tot expressie in pindazaden (Fig. 6b en Additional file 11). Interessant is dat de groep S genen AdbZIP24 en AdbZIP36 een vergelijkbaar expressiepatroon hadden als de groep C genen AdbZIP37 en AibZIP30: een afname in expressieniveau naarmate de zaadontwikkeling vorderde.
We onderzochten vervolgens verder de verschillen in genexpressie tussen homeologe genen uit de AA en BB genomen van de tetraploïde pinda. De heatmap-analyse gaf aan dat de algemene expressiepatronen gedurende de zaadontwikkeling vergelijkbaar waren voor 31 paren van homeologe/orthologe genen uit de AA- en BB-genen. We gebruikten de differentiële expressie analysemethode in combinatie met statistische methoden om de verschillen in genexpressie tussen deze genparen voor elk monster te berekenen. We vonden dat 3 genenparen (AdbZIP5 en AibZIP5, AdbZIP17 en AibZIP15, AdbZIP46 en AibZIP41) differentieel tot expressie kwamen bij 20 DAF, 3 genenparen (AdbZIP3 en AibZIP1, AdbZIP4 en AibZIP4, AdbZIP49 en AibZIP45) bij 40 DAF, en 5 paren (AdbZIP3 en AibZIP1, AdbZIP33 en AibZIP28, AdbZIP37 en AibZIP30, AdbZIP10 en AibZIP10, AdbZIP1 en AibZIP3) bij 60 DAF. Deze resultaten wezen op het algemene behoud van expressie tussen twee genomen, maar suggereerden dat 20% van de genen in expressie waren gedivergeerd tijdens de parallelle evolutie en polyploïdisatie van twee genomen (Fig. 6c).
qRT-PCR expressieprofielen van Arachis bZIP genen onder zoutstress
We gebruikten qRT-PCR om veranderingen in bZIP genexpressie in reactie op zoutbehandeling te onderzoeken (Fig. 7 en Aanvullend bestand 12). We waren niet in staat om 4 bZIPs duidelijk te amplificeren met PCR. Nadat pindawortels gedurende 1 uur met zout waren behandeld, kwamen 20 genen significant differentieel tot expressie; na 5 uur kwamen 27 genen significant differentieel tot expressie; en na 10 uur kwamen 41 genen significant differentieel tot expressie (Fig. 7j; Student’s t test: P < 0.05). Op elk tijdstip waren veel meer genen upgereguleerd dan downgereguleerd (14 vs. 6 bij 1 uur; 21 vs. 6 bij 5 uur; en 34 vs. 7 bij 10 uur). Onder deze differentieel tot expressie komende bZIPs na zoutbehandeling, waren veel van hen verdeeld in de groepen A en S (Fig. 7k), wat erop wijst dat bZIPs in deze groepen een belangrijke rol spelen in suikersignalering en abiotische stressregulatie.
Groep A bZIP’s bezitten de CKII- en Ca2+ -afhankelijke proteïnekinase-fosforylatieplaatsmotieven die betrokken zijn bij stress- en/of ABA-signalering, en deze motieven zijn belangrijk voor de aanpassing van planten aan diverse abiotische milieustressoren. Inderdaad, vele genen van groep A zijn geassocieerd met de zoutstressrespons. In Arabidopsis zijn ABI5 en ABFs/AREB belangrijke ABA-afhankelijke signaaltransductiefactoren betrokken bij abiotische stresstolerantie. De over-expressie van GhABF2 verbeterde de zoutstresstolerantie aanzienlijk, zowel in Arabidopsis als in katoen. In tomaat, slAREB1 en slbZIP1 knockout verhoogde zoutstress tolerantie, terwijl slAREB1 en slbZIP1 over-expressie verminderde zoutstress tolerantie . Hier werden de genen AdbZIP42 en AibZIP35 significant geüpreguleerd in reactie op zoutstress, en deze genen zijn homoloog aan ABFs, GhABF2, slAREB1, en slbZIP1. Bovendien is gerapporteerd dat deze genen worden gefosforyleerd door de ABA-geactiveerde SnRK2 proteïnekinasen, wat suggereert dat het fosforyleren van ABA response element-bindende factoren cruciaal kan zijn voor de ABA-gemedieerde zoutstressrespons.
De groep B genen AdbZIP45 en AibZIP40 werden na 10 uur zoutstress opgehoogd, en deze genen zijn homoloog aan AtbZIP17, wat de expressie van verschillende zoutstressresponsgenen in Arabidopsis zou kunnen verbeteren. Zeven groep G bZIP genen (AdbZIP7, AdbZIP15, AdbZIP19, AdbZIP50, AibZIP17, AibZIP21, en AibZIP38) waren homoloog aan Arabidopsis AtbZIP41 en tomaat slbZIP38, en van deze genen is aangetoond dat ze beiden zoutstress negatief reguleren. Van deze zeven genen werd AdbZIP15 significant gedownreguleerd na 1 uur en 5 uur behandeling met zoutstress, terwijl AdbZIP19 en AibZIP17 significant up-gereguleerd werden na 10 uur zoutstress. AdbZIP15, AdbZIP19 en AibZIP17 zouden dus resistentie kunnen verlenen tegen zoutstress. AdbZIP15 zou een negatieve regulator van zoutstress kunnen zijn, aangezien zijn expressiepatroon vergelijkbaar was met dat van slbZIP38 in reactie op zoutstress.
De groep S genen AdbZIP24 en AdbZIP36 waren homoloog aan AtbZIP1, AtbZIP53, MtbZIP2, en MtbZIP26, en de expressiepatronen van deze genen in reactie op zoutstress waren vergelijkbaar (Fig. 7). In het bijzonder werd AdbZIP36 significant hoger gereguleerd na 10 uur zoutstress. Van twee homologe genen in Arabidopsis, AtbZIP1 en AtbZIP53, werd aangetoond dat ze het primaire koolhydraat- en aminozuurmetabolisme herprogrammeren om wortels te helpen zich aan te passen aan zoutstress. De homologen MtbZIP2 en MtbZIP26 worden ook transcriptioneel geïnduceerd door zoutbehandeling, en verbeteren de tolerantie van de plant voor zoutstress. Opmerkelijk is dat het expressiepatroon van AdbZIP36 vergelijkbaar was met die van AtbZIP1, MtbZIP2 en MtbZIP26 in Arabidopsis en M. truncatula, wat suggereert dat AdbZIP36 een positieve regulator van tolerantie voor zoutstress in pinda’s zou kunnen zijn. Samenvattend heeft onze studie van expressieanalyse verschillende kandidaat pinda bZIPs geïdentificeerd, die geassocieerd kunnen worden met de zout-stress respons, als doelen voor toekomstig onderzoek.