Komparativ genomik af Salmonella enterica serovar Enteritidis ST-11 isoleret i Uruguay afslører lineager forbundet med bestemte epidemiologiske træk

sep 15, 2021
admin

Komparativ genomik

Først sammenlignede vi de 61 Uruguayanske isolater ved hjælp af SNP-analyse med P125109-genomet som reference. Denne analyse viste, at de to ældste isolater har mere end 600 SNP’er, der adskiller sig fra referencegenomet (607 og 652 for henholdsvis 31/88 og 08/89), mens alle de øvrige 59 isolater har mindre end 200 SNP’er (fra 60 til 166) (Supplerende tabel 1). På den anden side har alle uruguayanske genomer 17 SNP’er til forskel fra P125109-genomet.

En fylogenetisk analyse baseret på SNP’er afslørede eksistensen af to klasser, som vi kaldte E1 og E2 (fig. 1(b)), der omfatter 57 ud af de 61 stammer. Disse 57 stammer tilhører den vigtigste S. enterica serovar Enteritidis MLST-sekvencetype 11 (ST-11) og har været i samcirkulation i landet siden 1994. De resterende fire isolater (31/88, 8/89, 77/02 og 89/02) blev ikke grupperet i nogen af de to klasser (fig. 1(b)). Vi har tidligere rapporteret, at de to ældste isolater (31/88 og 8/89) tilhører MLST-sekvenstype 1974 (ST1974), og at ST1974 er opstået fra ST11 efter erhvervelse af en karakteristisk profage8. De to andre isolater, 77/02 og 89/02, tilhører ST11 som størstedelen af stammerne.

E1-kladen omfatter 21 stammer, der spænder over alle fem epidemiologiske perioder, og som blev isoleret fra fødevare-, dyre- eller menneskeinfektioner. I stedet er E2-kladen repræsenteret af 36 isolater, hvoraf 34 blev isoleret i de perioder, der var forbundet med epidemier (fig. 1(a,b)). Det er derfor rimeligt at opstille den hypotese, at E2 kan udgøre en linje, der var ansvarlig for S. enterica serovar Enteritidis-epidemierne i landet.

Der er tidligere rapporteret en fylogenetisk analyse af 203 stammer, der repræsenterer intra-serovar-diversitet blandt S. enterica serovar Enteritidis EBG4-isolater på verdensplan, som omfattede 6 af de 61 uruguayanske isolater, der blev anvendt i den foreliggende undersøgelse8. Som vi nu har fundet, er halvdelen af disse 6 stammer E1 og halvdelen E2 (E1: 53/94, 206/99 og 214/02; E2: 8/02, 251/01 og 253/01), og hver af disse to grupper er nært beslægtet med stammer fra Europa og Nordamerika. Denne relation er vist i supplerende figur S1, der indeholder den tidligere rapporterede fylogeni med et zoom på den klade, der dannes af disse stammer. Dette tyder på, at E1 og E2 kan have et bredt cirkulationsmønster.

For yderligere at understøtte denne antagelse udførte vi en ny fylogenetisk analyse, denne gang med fokus på stammer isoleret i regionen, herunder 12 fra Argentina, 122 fra Brasilien og de samme 61 genomer fra Uruguay (fig. 2(a)). Interessant nok fandt vi, at alle disse stammer grupperede sig på en meget lignende måde, som vi fandt blandt uruguayanske isolater, dvs. at E1-klyngen nu indeholder stammer fra Argentina og Brasilien, mens E2-klyngen indeholder stammer fra Brasilien (103 i E1 og 62 i E2). I betragtning af det lave antal genomer fra Argentina, der er tilgængelige i EnteroBase, kan vi ikke udelukke muligheden for, at linje E2 cirkulerede i dette land. Kun 30 stammer fra alle tre lande blev grupperet uden for E1 og E2, hvoraf 24 blev isoleret før 1994 (Fig. 2(a), Supplerende tabel 2). Alt i alt tyder vores resultater stærkt på, at E1- og E2-stammer blev introduceret i regionen omkring 1994 og siden da har cirkuleret i Uruguay, Brasilien, Argentina, Europa og Nordamerika, hvilket understøtter idéen om, at de begge udgør linjeformer af serovar Enteritidis.

Figur 2
figure2

(a) Fylogenetisk træ af de 195 genomer, herunder 61 fra Uruguay (hvide blade), 12 fra Argentina (lyseblå blade) og 122 fra Brasilien (gule blade). Grene af E1-linjen er farvet med blå farve. Forgreninger af E2-linjen er angivet med rødt. De højre baner repræsenterer med forskellige farver de alleliske varianter for henholdsvis ycdX, pduD, hsdM, ybiO, yiaN, aas og aceA. Se farvelegender inde i (b). Skalaenhederne repræsenterer ændringer pr. variantsted. (b) Gene alignments for de forskellige alleliske varianter for henholdsvis ycdX, pduD, hsdM, ybiO, yiaN, aas og aceA. Generne er afbildet som annoteret i det genom, der indeholder hver variant, og er afstemt med referencen P125109. Skalaen for tilpasningen i basepar (bp) er angivet med vandrette streger. SNP’er, der er knyttet til hver variant i forhold til referencegenomet, er anført i tabel 1. SNP’er, der forårsager ikke-synonyme varianter, er markeret som X → Y (i aminosyrekode med et enkelt bogstav) i forhold til deres placering i genet. Synonyme SNP’er er kun markeret i forhold til deres position i genet (syn SNP).

Vi udførte derefter en komparativ genomisk analyse med det formål at identificere genetiske forskelle i forbindelse med linjeføringer E1 og E2, herunder 165 genomer: 57 fra Uruguay, 11 fra Argentina og 97 fra Brasilien (Fig. 2(a)).

Alleliske varianter blandt E1- og E2-linjerne

Da vi ikke fandt forskelle i accessoriske genomer mellem E1- og E2-linjerne, søgte vi efter SNP-forskelle blandt de 165 udvalgte stammer. Denne analyse viste, at de vigtigste forskelle mellem E1 og E2 er placeret i tre gener: ycdX, pduD og hsdM. Disse gener er afbrudt i E1-generne sammenlignet med deres modstykker i E2-generne. Desuden fandt vi alleliske varianter i andre fire gener, ybiO, yiaN, aas og aceA, som er specifikke for hver slægt (fig. 2(a,b); tabel 1).

Tabel 1 SNP’er og genvarianter af de 7 genmarkører for slægterne E1 og E2.

Alle 103 E1-stammer (11 fra Argentina, 71 fra Brasilien og 21 fra Uruguay) viser en 4 basepars indsættelse placeret i genet ycdX (SEN1912) sammenlignet med referencen og med alle E2-stammer (tabel 1). Denne indsættelse introducerer et for tidligt stopkodon, hvilket kan give et pseudo-gen eller en afkortet version af proteinet (fig. 2(b) og tabel 1). ycdX-genet koder for en hydrolase, der hører til superfamilien af PHP-proteiner, som indeholder et NH2-terminalt php-domæne (polymerase histidinolphosphatase). Dette domæne er karakteristisk for DNA-polymerase III alfa-underenheden i bakterier og er involveret i korrekturlæsningsfunktionen22. Det er blevet foreslået, at YcdX er involveret i DNA-reparationsvejene i E. coli og kunne fungere som en nuklease eller en fosfatase i disse veje23. For nylig fandt Wang et al. to alleliske varianter for dette gen (ikke-synonyme SNP) mellem S. enterica serovar Enteritidis-isolater med markant forskellige evner til at overleve i æggehvide24. Inoue et al. viste, at mutation i ycdY (det tilstødende gen i ycdWXYZ-operonet) forårsagede undertrykkelse af sværmning i E. coli25.

Alle stammer fra E2-linjen har den samme alleliske variant for pduD-genet (SEN2039), mens 102 ud af de 103 stammer fra E1-linjen viser en basesubstitution, der indfører et stopkodon, svarende til den, der er observeret for ycdX (tabel 1). Den resterende stamme (dvs. 11/07 fra Uruguay) mangler helt pduD-genet (fig. 2(b) og tabel 1). pduD koder for en propandioldehydratase, som er en del af pdu-operonet, der koder for alle de proteiner, der er nødvendige for 1,2-propandiolkatabolismen. Dette operon, der blev erhvervet ved lateral genoverførsel i Salmonella26,27 , er forstyrret i forskellige serovarer, der forårsager invasive ekstraintestinale infektioner hos mennesker, f.eks. bl.a. Typhi og Paratyphi A28. Faber et al. rapporterede, at funktionaliteten af dette operon kan være vigtig for at konkurrere med tarmmikrobiota, da 1,2 propandiol er et metabolisk produkt i det anaerobe tarmmiljø, som kan anvendes af Salmonella, når det kobles til den anaerobe tetrathionatrespiration29. Det foreslås, at evnen til at anvende 1,2 propandiol gør det muligt at udvide patogenpopulationen i tarmen, hvilket øger udskillelsen i fæces, hvilket er en vigtig faktor for epidemisk spredning29.

Dertil kommer, at alle E2-stammer har den samme alleliske variant for hsdM-genet (SEN4290), men blandt E1-stammerne er der flere varianter for dette gen (fig. 2(b) og tabel 1). De fleste E1-stammer indeholder varianter af hsdM, der enten vil give en afkortet version (4 ud af de 6 varianter) eller en ikke-synonym substitution af proteinet. Kun tre stammer i E1 (herunder den uruguayanske 44/07) har den samme variant som E2, hvilket tyder på, at det kun er i E1-stammer, at hsdM er tilbøjelig til at akkumulere mutationer (fig. 2(b)). hsdM-genet koder for en DNA-methylase, der er involveret i type I restriktionsmodifikationssystemet (RM) i enterobakterier30,31. Tidligere rapporter forbandt restriktionsmodifikationssystemer af type 2 med patogenicitet hos Salmonella på grund af epigenetiske virkninger på virulensgenekspressionen32. Silva et al. viste, at mutationer i RM-generne giver en forringet fænotype i musemodellen af invasiv salmonellose33. RM-systemer af type 1 blev også beskrevet som involveret i patogenicitet hos Yersinia pseudotuberculosis34.

Da E2, men ikke E1, har intakte kopier af ycdX, pduD og hsdM, og i betragtning af at disse gener tidligere er blevet impliceret i Salmonella-patogenicitet, kan det antages, at disse tre gener kan være relevante for E2-stammernes epidemiske evne. Vi undersøgte også de alleliske varianter i den globale fylogeni, der repræsenterer intra-serovar-diversiteten (Supplerende figur 1 og ref. 8), og fandt, at den fremherskende allel er E2-allelen i alle tilfælde, mens de forstyrrede varianter er specifikke for E1 (data ikke vist).

Som nævnt ovenfor blev der fundet yderligere fire gener ybiO, yiaN, aas og aceA med mindre sekvensforskelle mellem de to slægter. Disse fire gener har en enkelt variant i E2-stammer, mens E1-stammer for det meste er identiske med P125109-referencestammen.

Alle E2-stammer har en særlig allelisk variant af ybiO-genet (SEN0772) som følge af en substitution, der giver en Gly(601)→Arg i proteinet (fig. 2(a,b), tabel 1). ybiO-genet koder for et formodet mekanosensitivt kanalprotein, der er involveret i osmotisk tilpasning, og som aktiveres af hypo-osmotisk chok i E. coli35. Det er tidligere blevet rapporteret, at der findes to alleliske varianter for dette gen blandt S. enterica serovar Enteritidis-isolater, som har forskellig evne til at overleve i æggehvide24. For yiaN (SEN3494) (L-dehydroascorbattransporterens store permeaseunderenhed, et formodet membranprotein) har alle E2-genomer den samme allel, som adskiller sig i Gly(163)→Ala i forhold til E1. På samme måde har alle E2 den samme variant for aas (2-acylglycerophosphoethanolamin acyltransferase/acyl-ACP-synthetase, SEN2853) og aceA (isocitratlyase, SEN3966) generne. I E1 har de fleste stammer et aas-gen, der er identisk med referencegenet, og nogle få stammer har enten en ikke-synonym substitution (5 stammer) eller en synonym substitution (1 stamme) (fig. 2(a), tabel 1). På samme måde er aceA-genet identisk med referencen i alle E1-genomerne på nær ét.

Sammenfattende fandt vi, at E2-allelerne for ybiO, yiaN, aas og aceA er specifikke for denne slægt.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.