Das Genom des Raupenpilzes Ophiocordyceps sinensis bietet Einblicke in die Hochlandanpassung der Pilzpathogenität

Jan 12, 2022
admin

Genomsequenzierung, Assemblierung und Annotation

Wir sequenzierten O. sinensis aus dem Distrikt Nyingchi in Tibet, China. Wir führten eine WGS-Analyse mit den Next-Generation-Sequenzierungsplattformen Roche 454 und Illumina HiSeq 2000 durch. Dabei wurden saubere Sequenzdatensätze von ~5,4 Gb erzeugt, die eine ca. 45,1-fache Genomabdeckung ergeben (ergänzende Tabelle S1). Wir schätzten, dass die Genomgröße ~124,08 Mb und ~119,8 Mb beträgt, basierend auf der Durchflusszytometrie und der 17-Mer-Tiefenverteilung der sequenzierten Reads (ergänzende Abbildungen S1-2 und ergänzende Tabelle S2). Das O. sinensis-Genom wurde zunächst aus Roche 454 Long Reads mit Newbler16 assembliert, gefolgt vom Scaffolding vorassemblierter Contigs mit Illumina Mate Pair Sequencing Reads mit SSPACE17. Dies führte schließlich zu einer ~116,4 Mb großen Genomassemblierung, die ~97 % der geschätzten Genomgröße abdeckt und 156 Gerüste (>2 Kb) mit einem ScafN50-Wert von ~3 Mb und 9.141 Contigs (N50 = 21.423 bp) enthält (Tabelle 1 und ergänzende Tabellen S3-4). Um die Qualität des Genomaufbaus zu überprüfen, haben wir zunächst alle DNA und ESTs von O. sinensis, die in den öffentlichen Datenbanken verfügbar sind, kartiert und dabei Kartierungsraten von 98,85% bzw. 95,33% erzielt (Ergänzungstabelle S5). Zweitens ordneten wir alle sauberen Roche 454 Long Reads (~1,84 Gb) den assemblierten Genomsequenzen zu und erzielten eine nahezu perfekte Übereinstimmung mit einer Zuordnungsrate von 99,01% (Supplemental Table S5). Drittens zeigten die Transkripte, die wir assembliert haben, ein gutes Alignment zum assemblierten Genom; von 11.742 Transkripten wurden 91,29% zugeordnet (Transkriptabdeckung ≥80% und Identität ≥90%; Ergänzende Tabelle S5). Schließlich bewerteten wir die Vollständigkeit unserer O. sinensis Montage mit BUSCO18; 94,0%, 4,0% und 1,8% der 1.315 erwarteten Ascomycota BUSCO konservierten Gene wurden als vollständig, fragmentiert und fehlende in unserer O. sinensis Montage identifiziert, bzw. (Supplemental Table S5).

Tabelle 1 Vergleich der Genom-Merkmale zwischen O. sinensis und C. militaris.

Wir generierten ~15,05 Gb RNA-Sequenzierungsdaten (RNA-Seq) aus insgesamt sechs Bibliotheken, die die drei wichtigsten Entwicklungsstadien repräsentieren, um die Genvorhersage zu unterstützen (ergänzende Abbildung S4 und ergänzende Tabellen S6,7). In Kombination mit Ab-Initio-Vorhersagen, Protein- und EST-Alignments, EvidenceModeler-Kombinationen und weiteren Filtern konnten wir 7.939 proteinkodierende Gene definieren (Tabelle 1 und ergänzende Tabelle S8). Von diesen vorhergesagten Genen konnten ca. 97,0 % und 71,51 % funktionell klassifiziert bzw. durch RNA-Seq-Daten bestätigt werden (Ergänzende Tabellen S9-11). Unter Verwendung der BUSCO aus der Ascomycota-Linie fanden wir außerdem heraus, dass 94,4 %, 3,6 %, 1,8 % und 0,2 % der Gene vollständig, fragmentiert, fehlend bzw. dupliziert waren, was auf eine gute Qualität unserer Genannotation hinweist (Ergänzungstabelle S11). Wir führten auch eine Homologensuche durch und annotierten nichtcodierende RNA (ncRNA)-Gene, die 146 Transfer-RNA (tRNA)-Gene, 33 ribosomale RNA (rRNA)-Gene, 70 kleine nukleare RNA (snoRNAs)-Gene und 15 kleine nukleare RNA (snRNA)-Gene ergaben (Ergänzende Abbildung S6 und Ergänzende Tabelle S12). Die Annotation von Wiederholungssequenzen zeigte, dass transponierbare Elemente (TEs) etwa 74,67 % des assemblierten Genoms und 80,07 % der Rohdaten ausmachten, was darauf hindeutet, dass ~5,45 % des nicht assemblierten Genoms aus TEs besteht (Ergänzende Tabellen S13-14). Der GC-Gehalt betrug 43,09 % im gesamten Genom und 61,49 % in kodierenden Sequenzen (ergänzende Abbildung S3; ergänzende Tabellen S4 und S8). Wir haben 8.918 einfache Sequenzwiederholungen annotiert, die wertvolle genetische Marker zur Unterstützung zukünftiger Zuchtprogramme des chinesischen Raupenpilzes liefern werden (ergänzende Tabellen S15-16 und ergänzende Abbildung S7).

Retrotransposon-gesteuerte Genomexpansion und massive Entfernung nicht-kollinearer Gene

Der Vergleich der Genomgrößen zeigte, dass das Genom von O. sinensis fast 3,4-mal größer war als das anderer entomopathogener Pilze der Familie der Hypocreales (Supplemental Table S17 und Supplemental Figure S8A). Eine Wiederholungssequenzanalyse ergab, dass diese Expansion in erster Linie auf eine rasche Vermehrung transponierbarer Elemente zurückzuführen ist. Ungefähr 74,67 % des O. sinensis-Genoms bestanden aus sich wiederholenden Sequenzen (Ergänzende Tabellen S13-14), was außerordentlich viel mehr ist als bei Metarhizium anisopliae (~0,98 %)19, Metarhizium acridum (~1,52 %)19, Cordyceps militaris (~3,04 %)20 und Beauveria bassiana (~2,03 %)21 (P < 4,822e-07) (Ergänzende Abbildung S8B). Die MULE-Elemente waren mit ~1,6 % (~1,9 Mb) des O. sinensis-Genoms und mehr als 59 % der DNA-Transposons in O. sinensis die am häufigsten vorkommenden. Retrotransposons, meist langterminale Repeat (LTR) Retrotransposons, umfasste ~59,76% des O. sinensis Genoms und groß angelegte Verbreitung von denen etwa bei ~38 Millionen Jahren (MYA) (Supplemental Figure S9) aufgetreten.

Im Gegensatz zur raschen Amplifikation von LTR-Retrotransposons, die die Expansion des O. sinensis-Genoms vorantreibt, ist ein weiteres bemerkenswertes Merkmal der dramatische Verlust von proteinkodierenden Genen in der O. sinensis-Linie im Vergleich zu anderen entomopathogenen Pilzen. Im Vergleich zu insgesamt 7.939 proteinkodierenden Genen in O. sinensis gab es in anderen entomopathogenen Pilzen durchschnittlich mehr als 10.095 Gene, z. B. in Metarhizium anisopliae (10.582)19, Metarhizium acridum (9.849)19, Cordyceps militaris (9.684)20, Beauveria bassiana (10.366)21 und Tolypocladium inflatum (9.998)22 (Tabelle 1). Eine solche Verringerung der Genzahl wurde auch durch die Identifizierung nicht-kollinearer Gene und die vergleichende Analyse von Syntenie-Blöcken zwischen den Genomen von O. sinensis und C. militaris belegt. Wir identifizierten insgesamt 308 syntenische Blöcke, die sich über fast 72,7 % (~23,4 Mb in C. militaris vs. ~43,5 Mb in O. sinensis) des C. militaris-Genoms erstrecken (Abb. 1A; Ergänzende Abbildung S10 und Ergänzende Tabellen S18-19). Von diesen syntenischen Genomregionen gab es in O. sinensis (2.127) weniger nicht-kollineare Gene als in C. militaris (3.259), dafür aber mehr Wiederholungssequenzen (23,8 Mb in O. sinensis vs. 0,40 Mb in C. militaris) (Abb. 1B und Zusatztabelle S19). Die funktionelle Annotation der 2.468 Gene, die in O. sinensis verloren gingen, zeigte, dass sie hauptsächlich am Aminosäurestoffwechsel beteiligt waren, z. B. an der Biosynthese von Aminosäuren (ko01230), am Arginin- und Prolin-Stoffwechsel (ko00330) und am Tyrosin-Stoffwechsel (ko00350) (ergänzende Abbildung S11 und ergänzende Tabelle S20). Bemerkenswert ist, dass fast 81 % der Wiederholungssequenzen in diesen 308 syntenischen Blöcken LTR-Retrotransposons waren, von denen 40,4 % Gypsy-Retroelemente waren (Abb. 1B und ergänzende Tabelle S19). Die molekulare Datierung schätzt, dass diese spezielle Klasse von LTR-Retrotransposons ~38 Mya amplifiziert wurde, was mit der Hebung des Qinghai-Tibet-Plateaus übereinstimmt (Abb. 1C).

Abbildung 1
Abbildung1

Genomgrößenvariation. (A) Kollineare Blöcke zwischen O. sinensis und C. militaris. Die größten neun Gerüstblöcke von C. militaris sind mit roten Zahlen hervorgehoben. Vollständige Gerüste sind in der ergänzenden Abbildung S10 dargestellt. Kollineare Blöcke werden mit dem MCScanX-Paket mit Standardparametern identifiziert. (B) Unterschiede in der genomischen Zusammensetzung. Ungefähr 23,4 Mb (72,7 % des Gesamtgenoms) und 43,5 Mb (37,5 %) der Genome von C. militaris und O. sinensis sind auf 308 syntenische Blöcke abgebildet. Es wird eine signifikante Expansion der LTR-Retrotransposons und der Verlust von nicht-kollinearen Genen beobachtet. (C) LTR-Retrotransposon-Expansion in kollinearen Blöcken von O. sinensis. Die X-Achse zeigt die prozentuale Identität der LTRs an, während die Y-Achse die Anzahl der LTR-Retrotransposon-Insertionen darstellt.

Rasche Evolution von Genfamilien, die mit der Pathogenität von Pilzen zusammenhängen

Eines der auffälligsten Merkmale des O. sinensis-Genoms ist der Mangel an hoch homologen Genpaaren. Von den vorhergesagten 7.939 proteinkodierenden Genen gab es keine Paare mit einer Aminosäureidentität von >90 % in den kodierenden Sequenzen und nur ein Paar mit einer Aminosäureidentität von >80 % (Abb. 2A und Zusatztabelle S21). Dieses Merkmal wurde auch bei dem eng verwandten C. militaris und dem Ektomykorrhizapilz Tuber melanosporum 23 beobachtet. Im Vergleich zu anderen entomopathogenen Pilzen wie B. bassiana und C. militaris waren die Multigenfamilien in O. sinensis zahlenmäßig begrenzt und machten nur 8,7 % des vorhergesagten Proteoms aus; die meisten Genfamilien hatten nur zwei Mitglieder (ergänzende Abbildung S12). Der Zuwachs an Genen war auffallend geringer als der Verlust von Genen, und von den 7.800 Genfamilien, die im jüngsten gemeinsamen Vorfahren (MRCA) der Hypocreales gefunden wurden, sind in O. sinensis offenbar 1.756 verloren gegangen (Abb. 2B). Ein derart kompakter Genkodierungsraum des O. sinensis-Genoms deutet auf die Natur dieses hochspezialisierten Pilzes mit einer geringen Fähigkeit zur Anpassung an mehrere Umweltfaktoren hin.

Abbildung 2
Abbildung2

Genfamilienentwicklung. (A) Charakterisierung der paranalogen Gene bei fünf entomopathogenen Pilzen. Abkürzungen: OSI, O. sinensis; MAN, M. anisopliae; MAC, M. acridum; CMI, C. militaris; BBA, B. bassiana; SCE, S. cerevisiae. Die x-Achse zeigt die Aminosäureidentität für jedes paraloge Paar, während die z-Achse die Gesamtzahl der paranalogen Gene innerhalb der Identitätsgruppen angibt. Paraloge Genpaare wurden auf der Grundlage von Vergleichen zwischen allen Genen innerhalb derselben Spezies mit dem Programm Blastall (Version 2.2.26) ermittelt. (B) Genexpansion und -kontraktion im Genom von O. sinensis. Die Anzahl der Genfamilien, die eine Expansion (rot) oder Kontraktion (grün) für jede Abstammungslinie nach der Speziation aufweisen, sind auf jedem Zweig des phylogenetischen Baums angegeben, wobei die Position von O. sinensis hervorgehoben ist (blaues Sternchen). (C) Venn-Diagramm, das die einzigartigen und gemeinsamen Genfamilien der fünf Pilzgenome zeigt. Die tatsächlichen Gennummern sind in Klammern angegeben.

Um die Entwicklung von Genfamilien zu verstehen, die mit der Pathogenität von Pilzen und der Anpassung an raue Umgebungen im Hochland zusammenhängen, haben wir die funktionellen Eigenschaften von Genfamilien untersucht, die in O. sinensis Erweiterungen oder Kontraktionen erfahren haben. Das Genom von O. sinensis wies eine beträchtliche Expansion von Genfamilien auf, die hauptsächlich an der Pathogenität von Pilzen beteiligt sind, darunter die Peroxidase-Aktivität (PF01328; P < 0.01), Serinhydrolase (PF03959; P < 0,01), Deuterolysin-Metalloprotease (M35) Peptidase (PF02102; P < 0,01) und Cytochrom P450 (PF00067; P < 0,01) (Ergänzende Tabelle S23). Interessanterweise stellten wir fest, dass die erweiterten Genfamilien auch funktionell in der Pfam-Kategorie der Glukose-Methanol-Cholin (GMC)-Oxidoreduktase angereichert sind, die in den Ecdysteroid-Stoffwechsel der Häutung bei Insekten involviert ist (ergänzende Tabelle S23). Im Vergleich mit anderen entomopathogenen Pilzen wurde die Erweiterung der Genfamilie in der O. sinensis-Linie auch mit einer Überrepräsentation von Pfam-Begriffen beobachtet, die vermutlich mit der Anpassung an niedrige Temperaturen zusammenhängen (PF06772; P < 0,01) (Supplemental Table S23).

Im Gegensatz dazu waren Genfamilien, die einen Kontraktionsstatus aufwiesen, hauptsächlich am Transportprozess und Energiestoffwechsel beteiligt, wie ABC-Transporter (PF00005; P < 0,01), Aminosäurepermease (PF00324; P < 0,01) und ATP-Synthase (PF00306; P < 0,05) (Ergänzende Tabelle S24). Abgesehen von der dynamischen Evolution dieser Genfamilien entdeckten wir außerdem 1.077 (~13,57 %) artspezifische Gene in O. sinensis (Abb. 2C). Davon konnten 318 (~29,53 %) Gene funktionell annotiert werden und waren signifikant in GO-Kategorien angereichert, die mit Stärkebindung (GO: 2001070; P < 0,01), Pathogenese (GO: 0009405; P < 0.01), und Zellwand Makromolekül katabolischen Prozess (GO: 0016998; P < 0,01) (Supplemental Table S25).

Um die Infektion von Pilzpathogenen zu vermeiden, produzieren Insektenwirte oft schnell viel reaktive Sauerstoffspezies (ROS), um Pathogene direkt zu töten. Als Reaktion darauf haben Pathogene im Laufe der Evolution ein antioxidatives ROS-Abwehrsystem entwickelt, dessen Peroxidasen, die als ROS-fangende Enzyme fungieren, als eine der prominentesten und wichtigsten Komponenten gelten24, 25. Unter den erweiterten Genen in O. sinensis war die Peroxidase-Aktivität eine der am stärksten angereicherten funktionellen Kategorien (ergänzende Tabelle S23). Hidden Markov Model (HMM)-Suchen ergaben 42 (~0,53 %) Peroxidase-Gene in O. sinensis, deren Anzahl bemerkenswert größer war als die von C. militaris (28) und Hefe (21), was darauf hindeutet, dass eine zweifache Erweiterung der Peroxidase-Gene potenziell zu einer starken Kapazität zur Unterstützung der ROS-Entgiftung in O. sinensis führen könnte (Abb. 3A und ergänzende Tabelle S26). Unter diesen 42 Peroxidase-Genen ist die Haloperoxidase (Häm) mit einem Anteil von 16,67 % an der Gesamtzahl der nachgewiesenen Peroxidasen am häufigsten vertreten (Abb. 3B). Im Gegensatz zu anderen eng verwandten Pilzarten, denen das typische 2-Cystein-Peroxiredoxin vollständig fehlt, ist bei O. sinensis noch eine Kopie vorhanden (Abb. 3B). Es wurde bereits gezeigt, dass 2-Cys-Peroxiredoxin bei Vibrio vulnificus eine Rolle bei der Reaktion auf verschiedene Stufen von oxidativem Stress spielt 26. Eine vergleichende Analyse ergab, dass das erhaltene Gen in O. sinensis zum Prx1-Typ gehört, von dem berichtet wurde, dass er funktionell konserviert ist27 und nur dann exprimiert wird, wenn die Zellen hohen Mengen von exogen erzeugtem H2O2 ausgesetzt sind26.

Abbildung 3
Abbildung3

Analyse der Peroxidase-Gene und positive Selektion. (A) Vergleiche des Prozentsatzes und der Anzahl (Klammern) der Peroxidase-Gene zwischen den fünf entomopathogenen Pilzen und Hefe (S. cerevisiae). Abkürzungen: TIN, T. inflatum; SCE, S. cerevisiae. (B) Peroxidase-Gensubtypen sind durch fPoxDB (http://peroxidase.riceblast.snu.ac.kr) definiert. Die Anzahl der Gene innerhalb jeder Peroxidaseklasse wird mit Hilfe des im Programm R (Version 3.0.1) implementierten Pakets „pheatmap“ dargestellt. (C) Positiv ausgewählte Gene (PSGs), die in der O. sinensis-Abstammung entdeckt wurden. 12 PSGs, die möglicherweise mit der Höhenanpassung und der Wirtsinfektion in Verbindung stehen, sind dargestellt (rechtes Feld). Phylogenetische Beziehungen zwischen 13 Pilzarten (linkes Feld). Pflanzenpathogene sind durch schwarze Kreise gekennzeichnet, während Insektenpathogene durch rote Rauten dargestellt sind. S. cerevisiae wurde als Außengruppe ausgewählt und in einem grünen Dreieck dargestellt.

Im Gegensatz zum Infektionsmechanismus von Pflanzenpathogenen (PPs), der kohlenhydrataktive Enzyme (CAZyme) zum Abbau der komplexen Pflanzenzellwand benötigt28, infizieren Insektenpathogene (IPs) ihre Wirte in der Regel durch Durchdringung der Kutikula29. Um dies zu testen, verglichen wir O. sinensis mit vier weiteren Insektenpathogenen (M. anisopliae, M. acridum, C. militaris und B. bassiana) mit den vier Pflanzenpathogenen (Fusarium graminearum, Magnaporthe grisea, Grosmannia clavigera und Botrytis cinerea) (ergänzende Tabelle S17). Unsere Ergebnisse zeigten, dass Insektenpathogene im Vergleich zu Pflanzenpathogenen mehr Proteasen (im Durchschnitt 362 in IPs vs. 342 in PPs; P < 0,43) und Proteinkinasen (im Durchschnitt 151 in IPs vs. 119 in PPs; P < 0,0014) zum Abbau der Insektenkutikula besitzen (Ergänzungstabellen S27-29). Im Gegensatz dazu beherbergten Pflanzenpathogene mehr CAZyme als Insektenpathogene für den Abbau von Pflanzenzellwänden (im Durchschnitt 161 in IPs vs. 231 in PPs) (Ergänzende Tabellen S30-32). Ohne Berücksichtigung der pflanzlichen Pathogene wies O. sinensis bemerkenswerterweise weniger Gene auf, die für Proteasen kodieren (260) als andere Insektenpathogene, wie M. anisopliae (437), M. acridum (361), C. militaris (355) und B. bassiana (396). Allerdings enthalten ~35 % dieser in O. sinensis charakterisierten Proteasen ein Signalpeptid, das wahrscheinlich eher an Pathogen-Wirt-Interaktionen beteiligt war (ergänzende Tabellen S10 und S34), was mehr ist als bei anderen entomopathogenen Pilzen (im Durchschnitt 20 %). Ähnlich wie bei anderen Insektenpathogenen nahmen auch bei O. sinensis mehrere Cellulase-Familien, darunter GH7, GH45 und GH51, ab oder waren nicht vorhanden (Ergänzungstabelle S30).

Wir untersuchten auch Genexpressionsprofile über die drei Entwicklungsstadien von O. sinensis, wobei das Längenverhältnis von Pilz zu Insekt ~1,20×, ~1,75× und ~2,20× erreichte. Die Ergebnisse zeigen, dass insgesamt 411 Gene in den drei Entwicklungsstadien unterschiedlich exprimiert wurden (ergänzende Abbildung S14). Die funktionelle Annotation dieser 411 DEGs ergab, dass sie hauptsächlich an der Pilzpathogenität beteiligt waren, wie z. B. Glykosylhydrolasen der Familie 16 (PF00722; FDR < 0,01), Cytochrom P450 (PF00067; FDR < 0,01) und Major Facilitator Superfamily (PF07690; FDR < 0,05). Außerdem waren Gene, die für Enzyme im Zusammenhang mit der mitochondrialen Atmungskette kodieren, ebenfalls funktionell angereichert, wie die NAD-abhängige Epimerase/Dehydratase-Familie (PF01370; FDR < 0,01) und die N-terminale Domäne von BCS1 (PF08740; FDR < 0,01) (Ergänzende Tabelle S33).

Positive darwinistische Selektion dient als treibende Kraft für die Pathogenität von Pilzen

Positive Selektion hat zweifellos eine entscheidende Rolle bei der Evolution verschiedener Organismen gespielt, die in hochgelegenen Umgebungen des Qinghai-Tibet-Plateaus leben, und viele der phänotypischen Merkmale zeigen wahrscheinlich solche Selektionssignaturen3,4,5. Von den 1.499 hochwahrscheinlichen Single-Copy-Orthologen, die O. sinensis und die anderen 12 Pilzarten gemeinsam haben, wurden 163 positiv selektierte Gene (PSGs) in O. sinensis mit Hilfe des Branch-Site Likelihood Ratio Tests (LRT; P < 0,05) identifiziert (Supplemental Table S35). Davon wurde ein Gen (OSIN3929; hier OsPRX1 genannt) funktionell mit der Peroxidase-Aktivität in Verbindung gebracht (Abb. 3C). Dieses Gen ist ein Mitglied der Peroxiredoxin-Familie mit 1-Cystein und hoch homolog zu PRX1 (YBL064C) in S. cerevisiae 30. PRX1-Gene in S. cerevisiae und zwei humanpathogenen Pilzen, A. fumigatus und C. albicans, sind funktionell konserviert und für die Entgiftung des oxidativen Bursts in Wirtszellen erforderlich31, 32. Insbesondere die Deletion von PRX1 in dem bekannten Reispilz Magnaporthe oryzae führte zu einem fast vollständigen Verlust der Pathogenität, was darauf hindeutet, dass diese Peroxidase eine Schlüsselrolle bei der Interaktion zwischen Wirt und Pathogen spielt27. Auffallend ist, dass mehrere Gene, die an Wirts-Pathogen-Interaktionen beteiligt sind, einschließlich peroxisomaler Biogenese, Proteinkinase und Metallopeptidasen, ebenfalls unter positiver Selektion stehen (Abb. 3C).

Evolution des Paarungssystems

Bei Ascomyceten-Pilzen wird das Paarungssystem in der Regel durch den Paarungstyp-Locus (MAT) gesteuert33. Unsere Genomsequenzierungsanalyse ergab, dass O. sinensis nicht nur das Paarungstyp-Gen MAT1-2-1 innerhalb der MAT1-2-Idiomorphie besaß, sondern auch drei Paarungstyp-Gene (d. h. MAT1-1-1, MAT1-1-2 und MAT1-1-3) innerhalb der MAT1-1-Idiomorphie (ergänzende Abbildung S15B). Dieses Merkmal wurde mit Hilfe der Resequenzierung des gesamten Genoms von 31 natürlichen Populationen in nahezu dem gesamten geografischen Verbreitungsgebiet verifiziert, was darauf hindeutet, dass O. sinensis tatsächlich homothallisch ist (ergänzende Abbildung S15A und ergänzende Tabelle S36). Dieses Merkmal unterscheidet sich deutlich von den eng verwandten Pilzpathogenen wie Tolypocladium inflatum (MAT1-2)22, C. militaris (MAT1-1)20, B. bassiana (MAT1-1)21, M. anisopliae (MAT1-1)19 und M. acridum (MAT1-2)19, die heterothallisch sind und nur einen einzigen Paarungslocus besitzen. Ähnlich wie bei dem bekannten homothallischen Pflanzenpathogen Fusarium graminearum 34 zeigte die Organisation dieser beiden MAT-Loci in O. sinensis den Fusionsstatus innerhalb der idiomorphen genomischen Region, die besonders reich an LTR-Retrotransponen war. Die Spaltung zwischen dem homothallischen O. sinensis und dem heterothallischen C. militaris wurde auf fast 174,2 MYA geschätzt (ergänzende Abbildung S13C) und war im Laufe der Evolutionsgeschichte mehrfachen Umwandlungen des Paarungssystems von selbstinkompatibel zu selbstkompatibel unterworfen (ergänzende Abbildung S15C), ähnlich wie bei der fadenförmigen Ascomyceten-Gattung Neurospora 35.

Populationsdivergenz basierend auf Breitengraden auf dem Qinghai-Tibet-Plateau

Um die genomweiten Beziehungen und die Populationsdivergenz zu untersuchen, sammelten und sequenzierten wir 31 Akzessionen von O. sinensis in seinem bekannten Verbreitungsgebiet, einschließlich der Provinzen Qinghai, Sichuan, Yunnan und Gansu sowie der Autonomen Region Tibet auf dem Qinghai-Tibet-Plateau (Ergänzende Abbildung S16 und Ergänzende Tabelle S37). Wir generierten insgesamt 183 Millionen Paired-End-Reads (~36,68 Gb Sequenzen) mit einer durchschnittlichen Tiefe von ~10,1× (Rohdaten) (Supplemental Table S38). Aus diesen Daten generierten wir einen Satz von 816.960 Einzelnukleotid-Polymorphismen (SNPs) und 48.092 strikte Indels (Insertionen und Deletionen), um die Verwandtschaft zwischen den Populationen von O. sinensis zu bewerten (Ergänzende Abbildungen S18-19 und Ergänzende Tabelle S39). Die Mehrheit der genomischen Varianten (71,1 %) wurde den intergenischen Regionen zugeordnet, während ein Teil der Varianten den kodierenden Regionen zugeordnet wurde (23,3 %, bestehend aus 101.997 synonymen und 88.224 nicht-synonymen SNPs mit einem Substitutionsverhältnis von 0,86) (ergänzende Abbildung S19 und ergänzende Tabelle S39). Der phylogenetische Baum, der unter Verwendung der SNP-Datensätze erstellt wurde, teilte die 31 Akzessionen in drei geographisch getrennte Gruppen ein, die von Regionen in niedrigen bis zu hohen Breitengraden reichten (Abb. 4A) – ein Ergebnis, das durch PCA unter Verwendung des ersten und zweiten Eigenvektors verstärkt wurde (Abb. 4B und ergänzende Abbildung S20A). Die Variation der Anzahl der vermuteten Vorgängerpopulationen (K) zeigte, dass bei K = 3 die drei verschiedenen Gruppen mit der PCA und der phylogenetischen Rekonstruktion übereinstimmen (Abb. 4C und ergänzende Abbildung S20B). Einige Akzessionen aus der Gruppe in den niedrigen Breitengraden weisen starke Anzeichen für eine Vermischung auf und sind im Vergleich zu den anderen beiden Gruppen weiter verstreut, was auf eine größere genetische Vielfalt hindeutet, die möglicherweise auf gemeinsame Polymorphismen der Vorfahren und/oder rezente Introgressionsereignisse zurückzuführen ist (Abb. 4D, E). Die geschätzte Statistik der Populationsdifferenzierung (F ST ) zwischen diesen drei auf den Breitengraden basierenden Gruppen zeigte außerdem die basale Natur der Region der niedrigen Breitengrade, insbesondere der Populationen aus dem Nyingchi-Distrikt in Tibet, was durch die wesentlich höhere Nukleotiddiversität (π) innerhalb der Gruppe und die geringere Populationsdifferenzierung gegenüber den beiden anderen Gruppen der hohen Breitengrade weiter belegt wurde (Abb. 4C-F). (Abb. 4C-F).

Abbildung 4
Abbildung4

Populationsdivergenz von O. sinensis auf Basis der Breitengrade. (A) Neighbor-Joining (NJ) phylogenetischer Baum von 31 O. sinensis-Akzessionen, erstellt mit SNP-Daten. Der Skalenbalken stellt die mit der p-Distanz gemessenen evolutionären Abstände dar. (B) Zwei-Wege-Hauptkomponentenanalyse (PCA) unter Verwendung der identifizierten SNPs. Die fünf führenden Eigenvektoren erklären 71,4 % der Varianz, wobei 34,5 % auf Eigenvektor 1 und 20,1 % auf Eigenvektor 2 entfallen (ergänzende Abbildung S20A). (C) Populationsstruktur von O. sinensis. Jede Farbe und jeder vertikale Balken repräsentiert eine Population bzw. eine Akzession. Die y-Achse zeigt den Anteil jeder Akzession, der von den angestammten Populationen stammt. (D) Breitengradverteilung für die drei abgeleiteten Gruppen (G1, G2 und G3). Die Längen- und Breitengrade sowie die Höhenlagen der einzelnen Populationen wurden bei der Probenahme im Feld per GPS bestimmt (Ergänzungstabelle S37). (E) Nukleotiddiversität und Populationsdivergenz zwischen den drei Gruppen. Die Werte in Klammern geben die Nukleotiddiversität (π) für die Gruppen an, während die Werte zwischen den Paaren die durch F ST gemessene Populationsdivergenz darstellen. (F) Geografische Verteilung der 31 O. sinensis-Populationen und ihre Divergenz auf Basis der geografischen Breite. Die Karten wurden mit der ArcGIS-Software (Version 10.1; https://www.arcgis.com/features/index.html) erstellt.

Wir untersuchten ferner die Gene, die von unterschiedlichen SNP-Gehalten und nicht-synonymen Mutationen betroffen sind (Ergänzungstabelle S40). Die Analyse der funktionellen Anreicherung der Top-100-Gene mit dem höchsten SNP-Gehalt und/oder nicht-synonymen Mutationen zeigt, dass sie hauptsächlich am Stoffwechsel von Pilz-Sekundärmetaboliten beteiligt sind, wie Polyketid-Synthase-Dehydratase (PF14765; FDR < 0,01), KR-Domäne (PF08659; FDR < 0,01) und Kondensationsdomäne (PF00668; FDR < 0,01). Die funktionellen Kategorien, die mit der Fettsäurebiosynthese verbunden sind, waren ebenfalls angereichert, wie die Acyltransferase-Domäne (PF00698; FDR < 0,01) und die Beta-Ketoacyl-Synthase (PF00109 und PF02801; FDR < 0,01) (Ergänzende Tabellen S41-42).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.