Systematická charakterizace bZIP transkripčních faktorů a jejich expresních profilů během vývoje semen a v reakci na solný stres u podzemnice olejné
Identifikace, fylogenetická analýza a klasifikace skupin bZIP genů u A. duranensis a A. ipaensis
Na základě hledání homologie a ověření domén bylo v genomech A. duranensis a A. ipaensis identifikováno celkem 50 a 45 jedinečných genů bZIP. Podrobnosti o těchto genech, včetně ID genu, genomové pozice, složení domén a zařazení do skupiny, jsou uvedeny v doplňkovém souboru 1. Podle existujícího nomenklaturního systému jsme každému z těchto nových genů bZIP přiřadili jedinečné názvy: AdbZIP1-50 a AibZIP1-45. Po kontrole bZIP domén mělo 93 genů typickou bZIP doménu, včetně invariantního motivu N-× 7-R/K v základní oblasti a heptadové repetice Leu umístěné přesně devět aminokyselin před R/K směrem k C termínu (Additional file 2). Zbývající dva geny bZIP, AdbZIP28 a AibZIP22, měly neobvyklou substituci v základní oblasti: záměnu konzervovaného Arg/Lys (R/K) za IIe (I). Tato záměna byla zaznamenána i u jiných druhů .
Systematický výzkum rodiny genů bZIP byl poprvé proveden u Arabidopsis . Při této analýze byly rozlišeny a pojmenovány různé skupiny genů bZIP na základě jejich fylogenetických vztahů a funkčních rozdílů. Tento klasifikační systém byl od té doby přijat pro další druhy na základě seskupení genů bZIP z jejich vlastních genomů a genomů Arabidopsis . Zde jsme na základě analýzy maximální věrohodnosti (ML) proteinů bZIP z genomů Arachis a Arabidopsis identifikovali 11 odlišných kladů genů bZIP (skupiny A-I, S a U), všechny s vysokou bootstrapovou podporou (obr. 1). Klasifikace podskupin bZIP z Arachis byla dále potvrzena rekonstrukcí fylogenetického stromu po přidání bZIP ze sóji (Additional file 3). Většina kladů bZIP zahrnuje blízce příbuzné bZIP z Arachis a jejich ortology z Arabidopsis; klad E a F nemá odpovídající členy u A. duranensis nebo A. ipaensis. Pozoruhodné je, že geny bZIP v rámci jednoho kladu sdílely podobné skupinově specifické sekvenční charakteristiky, včetně struktury exonu/intronu, fází intronu, motivů MEME a predikce struktury vazebného místa (dále analyzováno níže). Tento vzorec mezidruhového seskupení skupin naznačuje, že skupinově specifické rysy vznikly před divergencí Arachis a Arabidopsis. V průběhu evoluce se však v genech bZIP různých rostlinných druhů nahromadilo také několik rozdílů.
Struktura genů bZIP Arachis
Jelikož uspořádání intronů a exonů může naznačovat evoluční trajektorii genů bZIP , zkoumali jsme strukturu genů bZIP Arachis, včetně počtu intronů, délky a fáze sestřihu (Additional file 4). Zjistili jsme, že celková struktura genů je u genů Arachis bZIP v rámci stejné fylogenetické skupiny stejná nebo podobná. Vzhledem k počtu intronů u bZIP burských oříšků bylo 24 % AdbZIP a 22 % AibZIP bez intronů, které se vyskytovaly výhradně ve skupinách S a B. Mezi geny obsahujícími introny se počet intronů u genů AdbZIP a AibZIP pohyboval od 1 do 13. Nejvíce intronů měly geny bZIP ve skupině G, což odpovídá pozorováním v genomech jiných luštěnin .
Fáze sestřihu byly označeny jako tři fáze sestřihu: fáze 0 (P0), sestřih probíhal po třetím nukleotidu kodonu; fáze 1 (P1), sestřih probíhal po prvním nukleotidu kodonu; a fáze 2 (P2), sestřih probíhal po druhém nukleotidu. Fáze míst sestřihu v rámci otevřených čtecích rámců (ORF) byly různé, ale byly vysoce konzervované v základních a závěsných oblastech domény bZIP, protože jakékoli změny v těchto oblastech by ovlivnily jejich kód a funkci. Na základě polohy intronu a přítomnosti nebo počtu sestřihových fází v doméně bZIP byly identifikovány čtyři vzory intronů (a až d) v genech bZIP Arachis (obr. 2 a doplňkový soubor 2). Vzor a měl pouze jeden intron vložený na pozici – 5 v oblasti závěsu, mezi aminokyselinami Gln a Ala; tento vzor byl identifikován u všech genů bZIP Arachis ve skupinách A a G. Vzor b měl dva introny s fází 0, jeden v základní oblasti a druhý v oblasti závěsu; tento vzor byl identifikován u všech genů bZIP ve skupině D. Vzor c měl jeden intron vložený na pozici – 20 v základní oblasti ve fázi 2 (P2) a obsahuje všechny geny bZIP ve skupinách C a H. Vzor d postrádal introny v základní oblasti a v oblasti závěsu a zahrnuje všechny geny bZIP ve skupinách B a S. Kromě toho většina genů bZIP Arachis vykazujících vzor d byla bez intronu, s výjimkou AdbZIP45 a AibZIP40. Každý z těchto genů měl jeden intron mimo základní a závěsnou oblast. Zde pozorované vzorce fáze sestřihu v doméně Arachis bZIP byly v souladu se vzorci pozorovanými u jiných druhů . Vysoká míra zachování struktury genů a fází intronů v rámci fylogenetických kladů podpořila přijaté skupinové zařazení a naznačila, že tyto různé vzorce sestřihu exonů mohou hrát důležitou roli ve funkční evoluci.
Složení motivů pro různé skupiny bZIP genů Arachis
Kromě domény bZIP bylo v genech bZIP pomocí nástroje pro analýzu MEME zjištěno mnoho dalších konzervovaných motivů. Jak ukazuje obr. 3, bylo identifikováno celkem 18 konzervovaných motivů mimo doménu bZIP a pro každou podskupinu bylo sestaveno konsenzuální složení motivů (doplňkový soubor 5). Tyto konsenzuální motivy naznačily, že celkové složení motivů bylo podobné v rámci jedné podskupiny, ale lišilo se mezi různými skupinami. To naznačuje, že funkční divergence genů bZIP může být určena motivy specifickými pro danou skupinu. Individuální zkoumání těchto motivů ukázalo, že mnohé z nich jsou skupinově specifické. Například motivy 1, 2, 3 a 10 byly identifikovány pouze ve skupině D; motivy 5, 14 a 15 byly identifikovány pouze ve skupině G; motiv 6 byl identifikován pouze ve skupině I a motiv 9 byl identifikován pouze ve skupině H. Některé motivy mohou být spojeny se specifickými biologickými funkcemi. Například motiv 1 je doména DELAY OF GERMINATION (DOG) 1, která je nezbytná pro indukci dormance a více aspektů zrání semen, částečně tím, že zasahuje do signálních složek ABA . Motiv 3 obsahuje potenciální fosforylační místa kaseinkinázy II (CK II) (S/TxxD/E), která hrají klíčovou roli při dělení a expanzi buněk a ovlivňují různé vývojové dráhy a dráhy reakce na stres . Je zajímavé, že tyto motivy specifické pro danou skupinu byly identifikovány také v bZIP ze stejné skupiny v genomech jiných luskovin , což naznačuje, že složení motivů je konzervováno napříč luskovinami.
Struktura a dimerizační vlastnosti DNA-vazebného místa bZIP Arachis
Jádrová základní oblast a oblast závěsu domény bZIP nezávisle určují specifitu vazby DNA, jak prokázalo několik experimentů . Neobvyklá záměna dvou invariantních míst, asparaginu (Asn/N; pozice: – 18) a argininu (Arg/R; pozice: – 10), změnila DNA vazebné specifity . Zarovnali jsme aminokyselinové sekvence základních a závěsných oblastí proteinů bZIP podzemnice olejné, abychom identifikovali konzervované a polymorfní aminokyselinové zbytky v rámci každé skupiny (doplňkový soubor 6). U žádného bZIP burských oříšků nebyly pozorovány záměny Asn/N v poloze – 18 . Všichni členové skupiny I však měli na pozici – 10 místo argininu (R) lysin (Lys/K), což je v souladu s bZIP skupiny I z jiných druhů luštěnin . Kromě toho měly AdbZIP28 a AibZIP22 (skupina U) hydrofobní izoleucinový (Ile/I) zbytek místo argininového (Arg/R) a bylo prokázáno, že taková záměna zcela inhibuje afinitu bZIP k AP1 u kvasinek a nerozpoznává G-boxy u rýže .
Sekvence Leu zipu zprostředkovává homo- a/nebo heterodimerizaci proteinů bZIP, o nichž je známo, že se vážou na DNA jako dimery . Oblast Leu zipper se skládá z heptadových opakování, aminokyseliny se označují a, b, c, d, e, f a g v rámci každé heptady . Protože aminokyseliny na pozicích a, d, e a g jsou blízko rozhraní Leuova zipu, jsou to právě tyto aminokyseliny, které primárně určují oligomerizaci Leuova zipu, stabilitu dimerizace a specifičnost dimerů. Analyzovali jsme složení aminokyselin nacházejících se v pozicích a, d, e a g arašídových bZIP (obr. 4a).
V pozici a, přibližně 20 % zbytků tvořil asparagin (Asn/N), který může vytvářet polární kapsu v hydrofobním rozhraní, což umožňuje stabilnější interakce N-N v poloze a↔a′ (odpovídající poloha v protilehlé šroubovici) ve srovnání s jinými aminokyselinami . Napříč různými heptadami měly druhá a pátá heptada nejvyšší frekvenci Asn/N zbytků v poloze a (61,46 %, resp. 60,22 %; obr. 4b). V poloze d (obr. 4a) se Leu vyskytoval ve 45 % všech bZIP burských oříšků a je jednou z nejvíce dimery stabilizujících alifatických aminokyselin . V poloze e mělo 37 % všech arašídových bZIP kyselé aminokyseliny D nebo E, zatímco v poloze g mělo 44 % všech arašídových bZIP bazické aminokyseliny R nebo K (obr. 4a). Předpokládá se, že tyto nabité aminokyseliny tvoří solné můstky mezi šroubovicemi při elektrostatických interakcích . Přitažlivé nebo odpudivé elektrostatické interakce g↔e′ mohou také vytvářet mezihelikální solné můstky, které ovlivňují specifičnost dimerizace a stabilitu . Pro zkoumání podílu nabitých zbytků v polohách e a g na řízení dimerizačních vlastností proteinů Arachis bZIP byly vypočteny frekvence přitažlivých a odpudivých párů g↔e′ v každé heptadě (obr. 4c). Ve všech heptadách byly atraktivní g↔e′ páry soustředěny ve druhé (15,6 %), páté (35 %) a šesté (30 %) heptadě, což naznačuje, že mohou vytvářet úplné atraktivní g↔e′ interakce a přispívat ke stabilitě prostřednictvím komplementace v heterodimeru. Tři skupiny zahrnující 28 podrodin (BZ1-BZ28) byly dále rozděleny na základě homo- a heterodimerizačních vlastností, zejména dimerizační specifity (Additional file 7).
Vliv duplikace celého genomu a tandemové duplikace na rozšíření rodiny genů Arachis bZIP
Identifikovali jsme kolineární duplikované bloky v genomech A. duranensis a A. ipaensis a ortologní kolineární bloky mezi dvěma genomy. Byly vypočteny párové synonymní vzdálenosti (hodnoty Ks) mezi paralogy a ortology v rámci kolineárních bloků a vyneseny jejich frekvenční distribuce (obr. 5a; bin Ks = 0,05). Vrcholová frekvence Ks mezi A. duranensis a A. ipaensis, představující průměrnou sekvenční variabilitu, byla 0,035. To představovalo sekvenční divergenci mezi těmito dvěma blízce příbuznými druhy rodu Arachis, která byla odhadnuta na dobu před ~ 2,16 milionu let . Dále byly vrcholy Ks pro paralogy A. duranensis a A. ipaensis 0,90, resp. 0,95, což odpovídá sekvenční divergenci rané papilionoidní události duplikace celého genomu (WGD), ke které došlo před ~ 58 miliony let .
Detekovali jsme 35 AdbZIP a 32 AibZIP zapojených do duplikovaných genomických bloků, což představuje přibližně 70 % (35/50) a 71 % (32/45) genů bZIP u každého druhu (obr. 5b a doplňkový soubor 8). Duplikované páry genů bZIP se navíc vyskytovaly buď v rámci jednoho chromozomu, nebo mezi chromozomy a některé z těchto párů byly segmentálně duplikovány jednou, dvakrát nebo třikrát. Tento výsledek naznačuje přednostní zachování genů a časté chromozomální uspořádání po WGD. Tandemové duplikace byly zjištěny pouze u dvou párů genů (AdbZIP33/AdbZIP34 a AdbZIP41/AdbZIP42) u A. duranensis a pouze u jednoho páru genů (AibZIP28/AibZIP29) u A. ipaensis. To naznačuje, že k tandemové duplikaci docházelo jen zřídka a při rozšiřování rodiny genů bZIP nebyla důležitější než segmentální duplikace. Pomocí fylogenetických a syntenických analýz jsme také identifikovali 35 ortologických párů genů bZIP mezi A. duranensis a A. ipaensis. Tyto geny byly také homeology mezi oběma subgenomy tetraploidního podzemnice olejné.
Pro pochopení evolučních omezení působících na bZIP geny Arachis jsme vypočítali hodnoty Ka/Ks pro každý duplikovaný pár bZIP genů u dvou druhů Arachis (Additional file 9). U většiny těchto párových srovnání byly hodnoty Ka/Ks menší než 0,5 (pouze jedno párové srovnání mezi duplikovanými AdbZIP a pouze dvě mezi duplikovanými AibZIP byly větší než 0,5). To naznačuje, že na duplikované bZIPs Arachis působila silná purifikační selekce, která odstranila škodlivé mutace na úrovni proteinů.
Analýza exprese genů bZIP Arachis během vývoje semen podzemnice olejné
Pro profilování exprese genů bZIP jsme použili naše dříve publikovaná data RNA-seq , která dokumentují expresi genů v semenech podzemnice olejné v různých vývojových stadiích: 20, 40 a 60 dní po odkvětu (DAF). Pomocí těchto dat jsme identifikovali hodnoty FPKM pro všechny bZIP Arachis a všechny diferenciálně exprimované bZIP ve třech vývojových stádiích. S výjimkou 24 bZIP, které nebyly exprimovány v žádném vývojovém stadiu, byly rozpoznány čtyři skupiny zahrnující odpovídající bZIP geny se specifickým expresním profilem (obr. 6a a doplňkový soubor 10). První skupinu tvořilo 37 bZIPs, které byly během raného vývoje (20 DAF) regulovány směrem nahoru, ale později (ve 40 a 60 DAF) směrem dolů. Druhou skupinu tvořilo 15 bZIP, které byly ve 40 DAF regulovány směrem nahoru, zatímco třetí skupina zahrnovala 17 bZIP, které byly ve 40 DAF regulovány směrem dolů. Čtvrtou skupinu tvořilo 22 bZIP, které byly vysoce exprimovány ve všech třech vývojových stadiích. Vysoce exprimované bZIPy ve čtvrté skupině byly rozloženy hlavně v kladech A, C a S. Některé z těchto bZIPů byly homologní s geny, které se podílejí na vývoji semen u jiných rostlin, jako je Arabidopsis , rýže a kukuřice . Zde bylo pro potvrzení qRT-PCR vybráno 12 bZIPs, které byly vysoce exprimované a homologní s předchozími dobře prozkoumanými geny ve vývoji semen, a bylo zjištěno, že expresní vzorce stanovené pomocí RNA-seq jsou v souladu se vzorci zjištěnými pomocí qRT-PCR (obr. 6b).
Ve skupině A byly AdbZIP33 a AibZIP28 ortologické k Arabidopsis ABA insensitive 5 (ABI5), který je spojen s ABA-signalizací a také s regulací vývoje semen a dlouhověkosti u Arabidopsis a luštěnin . Naše výsledky RNA-seq a qRT-PCR ukázaly, že obě ortologní kopie ABI5 ze dvou subgenomů tetraploidního podzemnice olejné byly během vývoje vysoce exprimovány, což naznačuje, že funkce těchto genů může být u podzemnice olejné a Arabidopsis podobná. Naše výsledky qRT-PCR také ukázaly, že geny skupiny A AdbZIP42, AdbZIP48 a AibZIP31 byly během vývoje stabilně exprimovány (obr. 6b a doplňkový soubor 11). Tyto geny jsou homologní genům ABF a AREB, které se podílejí na vývoji semen, klíčení a zrání embryí zprostředkovaném ABA . Tři geny ve skupině C (AdbZIP23, AdbZIP37 a AibZIP30) byly také vysoce exprimovány a jsou homologní kukuřičnému bZIP faktoru Opaque2. Opaque2 reguluje akumulaci proteinů a metabolismus aminokyselin a cukrů v semenech kukuřice . Kromě toho byly v semenech podzemnice olejné extrémně vysoce exprimovány geny skupiny S AibZIP10, AdbZIP12, AdbZIP24, AdbZIP26 a AdbZIP36 (obr. 6b a doplňkový soubor 11). Zajímavé je, že geny skupiny S AdbZIP24 a AdbZIP36 měly podobný vzorec exprese jako geny skupiny C AdbZIP37 a AibZIP30: pokles úrovně exprese s postupujícím vývojem semen.
Dále jsme zkoumali rozdíly v expresi genů mezi homeologickými geny z genomů AA a BB tetraploidního podzemnice olejné. Analýza heatmap ukázala, že celkové vzorce exprese v průběhu vývoje semen byly podobné u 31 párů homeologických/orthologických genů z genomů AA a BB. Použili jsme metodu analýzy diferenciální exprese v kombinaci se statistickými metodami k výpočtu rozdílů v expresi genů mezi těmito dvojicemi genů pro každý vzorek. Zjistili jsme, že 3 páry genů (AdbZIP5 a AibZIP5, AdbZIP17 a AibZIP15, AdbZIP46 a AibZIP41) byly rozdílně exprimovány při 20 DAF, 3 páry (AdbZIP3 a AibZIP1, AdbZIP4 a AibZIP4, AdbZIP49 a AibZIP45) při 40 DAF a 5 párů (AdbZIP3 a AibZIP1, AdbZIP33 a AibZIP28, AdbZIP37 a AibZIP30, AdbZIP10 a AibZIP10, AdbZIP1 a AibZIP3) při 60 DAF. Tyto výsledky naznačují celkové zachování exprese mezi oběma genomy, ale naznačují, že 20 % genů se během paralelní evoluce a polyploidizace dvou genomů v expresi lišilo (obr. 6c).
qRT-PCR expresní profily bZIP genů Arachis při solném stresu
Pomocí qRT-PCR jsme zkoumali změny v expresi bZIP genů v reakci na ošetření solí (obr. 7 a doplňkový soubor 12). Pomocí PCR se nám nepodařilo jednoznačně amplifikovat 4 geny bZIP. Po ošetření kořenů podzemnice olejné solí po dobu 1 h bylo významně diferenciálně exprimováno 20 genů, po 5 h bylo významně diferenciálně exprimováno 27 genů a po 10 h bylo významně diferenciálně exprimováno 41 genů (obr. 7j; Studentův t test: P < 0,05). V každém časovém bodě bylo mnohem více genů regulováno nahoru než dolů (14 vs. 6 po 1 h; 21 vs. 6 po 5 h; a 34 vs. 7 po 10 h). Mezi těmito diferenciálně exprimovanými bZIP po ošetření solí bylo mnoho z nich distribuováno ve skupinách A a S (obr. 7k), což naznačuje, že bZIP v těchto skupinách hrají důležitou roli v signalizaci cukru a regulaci abiotického stresu .
BZIP skupiny A mají motivy fosforylačních míst CKII a Ca2+ -závislé proteinkinázy, které se podílejí na signalizaci stresu a/nebo ABA, a tyto motivy jsou důležité pro adaptaci rostlin na různé abiotické stresory prostředí . Mnoho genů skupiny A je skutečně spojeno s reakcí na stres způsobený solí. U Arabidopsis jsou ABI5 a ABFs/AREB klíčovými faktory přenosu signálu závislými na ABA, které se podílejí na toleranci vůči abiotickému stresu . Nadměrná exprese GhABF2 výrazně zlepšila toleranci vůči solnému stresu jak u Arabidopsis, tak u bavlníku . U rajčete knockout slAREB1 a slbZIP1 zvýšil toleranci vůči solnému stresu, zatímco nadměrná exprese slAREB1 a slbZIP1 toleranci vůči solnému stresu snížila . Zde byly geny AdbZIP42 a AibZIP35 významně regulovány v reakci na stres ze soli a tyto geny jsou homologní s ABF, GhABF2, slAREB1 a slbZIP1. Kromě toho bylo zjištěno, že tyto geny jsou fosforylovány proteinkinázami SnRK2 aktivovanými ABA , což naznačuje, že fosforylace faktorů vázajících prvky odpovědi na ABA může být kritická pro odpověď na solný stres zprostředkovanou ABA.
Geny skupiny B AdbZIP45 a AibZIP40 byly po 10 h solného stresu regulovány nahoru a tyto geny jsou homologní s AtbZIP17, což by mohlo zlepšit expresi několika genů odpovědi na solný stres v Arabidopsis . Sedm bZIP genů skupiny G (AdbZIP7, AdbZIP15, AdbZIP19, AdbZIP50, AibZIP17, AibZIP21 a AibZIP38) bylo homologních s arabidopsis AtbZIP41 a rajčatovým slbZIP38 a u obou těchto genů bylo prokázáno, že negativně regulují solný stres . Z těchto sedmi genů byl AdbZIP15 významně downregulován po 1 h a 5 h působení solného stresu, zatímco AdbZIP19 a AibZIP17 byly významně upregulovány po 10 h působení solného stresu. Geny AdbZIP15, AdbZIP19 a AibZIP17 tedy mohou propůjčovat odolnost vůči solnému stresu. AdbZIP15 by mohl být negativním regulátorem solného stresu, protože jeho expresní vzorec byl podobný expresnímu vzorci slbZIP38 v reakci na solný stres.
Geny skupiny S AdbZIP24 a AdbZIP36 byly homologní s AtbZIP1, AtbZIP53, MtbZIP2 a MtbZIP26 a expresní vzorce těchto genů v reakci na solný stres byly podobné (obr. 7). Zejména AdbZIP36 byl významně regulován po 10 h solného stresu. Ukázalo se, že dva homologické geny v Arabidopsis, AtbZIP1 a AtbZIP53, přeprogramovávají primární metabolismus sacharidů a aminokyselin, aby pomohly kořenům přizpůsobit se solnému stresu . Homology MtbZIP2 a MtbZIP26 jsou rovněž transkripčně indukovány působením soli a zlepšují toleranci rostlin vůči solnému stresu . Pozoruhodné je, že exprese AdbZIP36 byla podobná expresi AtbZIP1, MtbZIP2 a MtbZIP26 u Arabidopsis a M. truncatula , což naznačuje, že AdbZIP36 může být pozitivním regulátorem tolerance vůči solnému stresu u podzemnice olejné. Souhrnně lze říci, že naše studie expresní analýzy identifikovala několik kandidátních bZIP podzemnice olejné, které mohou být spojeny s reakcí na solný stres, jako cíle pro budoucí výzkum
.