Comparative genomics of Salmonella enterica serovar Enteritidis ST-11 geïsoleerd in Uruguay onthult lijnen geassocieerd met bepaalde epidemiologische eigenschappen
Comparative genomics
Voreerst vergeleken we de 61 Uruguayaanse isolaten met behulp van SNP analyse met het P125109 genoom als referentie. Deze analyse toonde aan dat de twee oudste isolaten meer dan 600 SNP’s verschil vertonen met het referentiegenoom (607 en 652 voor respectievelijk 31/88 en 08/89), terwijl alle andere 59 isolaten minder dan tweehonderd SNP’s hebben (van 60 tot 166) (aanvullende tabel 1). Anderzijds delen alle Uruguayaanse genomen 17 SNPs van verschil met het genoom van P125109.
Een fylogenetische analyse gebaseerd op SNPs onthulde het bestaan van twee clades die we E1 en E2 noemden (Fig. 1(b)) die 57 van de 61 stammen omvatten. Deze 57 stammen behoren tot het belangrijkste S. enterica serovar Enteritidis MLST sequentietype 11 (ST-11) en zijn sinds 1994 in het land in omloop. De overige vier isolaten (31/88, 8/89, 77/02 en 89/02) behoorden tot geen van de twee clades (Fig. 1(b)). Wij hebben eerder gerapporteerd dat de twee oudste isolaten (31/88 en 8/89) behoren tot het MLST-sequentietype 1974 (ST1974) en dat ST1974 is ontstaan uit ST11 na de verwerving van een karakteristieke prophage8. De andere twee isolaten, 77/02 en 89/02, behoren net als de meerderheid van de stammen tot ST11.
De E1-clade omvat 21 stammen die alle vijf epidemiologische perioden omspannen, en werden geïsoleerd uit voedsel-, dier- of menselijke infecties. De E2-clade daarentegen wordt vertegenwoordigd door 36 isolaten, waarvan er 34 werden geïsoleerd in de perioden die met epidemieën samenhingen (Fig. 1(a,b)). Het is dus redelijk om te veronderstellen dat E2 een lijn kan vormen die verantwoordelijk was voor de S. enterica serovar Enteritidis epidemieën in het land.
Vroeger rapporteerden we een fylogenetische analyse van 203 stammen, die intra-serovar diversiteit vertegenwoordigen onder S. enterica serovar Enteritidis EBG4 isolaten wereldwijd, waaronder 6 van de 61 Uruguayaanse isolaten die in de huidige studie werden gebruikt8. Zoals we nu hebben gevonden, is de helft van deze 6 stammen E1 en de andere helft E2 (E1: 53/94, 206/99 en 214/02; E2: 8/02, 251/01 en 253/01), en elk van deze twee groepen is nauw verwant met stammen uit Europa en Noord-Amerika. Dit verband wordt getoond in aanvullende fig. S1, die de eerder gerapporteerde fylogenie bevat met een zoom op de clade die door deze stammen wordt gevormd. Dit suggereert dat E1 en E2 een breed circulatiepatroon kunnen hebben.
Om deze veronderstelling verder te ondersteunen hebben wij een nieuwe fylogenetische analyse uitgevoerd, ditmaal met de nadruk op stammen die in de regio zijn geïsoleerd, waaronder 12 uit Argentinië, 122 uit Brazilië en dezelfde 61 genomen uit Uruguay (Fig. 2(a)). Het is interessant vast te stellen dat al deze stammen geclusterd zijn op een manier die sterk lijkt op wat we bij de Uruguayaanse isolaten vonden, d.w.z. E1-cluster bevat nu stammen uit Argentinië en Brazilië, terwijl E2-cluster stammen uit Brazilië bevat (103 in E1, en 62 in E2). Gezien het lage aantal genomen uit Argentinië dat in EnteroBase beschikbaar is, kunnen we niet uitsluiten dat stam E2 in dit land circuleerde. Slechts 30 stammen uit de drie landen behoorden niet tot E1 en E2, waarvan er 24 vóór 1994 werden geïsoleerd (Fig. 2(a), supplementaire tabel 2). Al met al suggereren onze resultaten sterk dat E1- en E2-stammen rond 1994 in de regio werden geïntroduceerd en sindsdien in Uruguay, Brazilië, Argentinië, Europa en Noord-Amerika circuleren, wat het idee ondersteunt dat beide stammen lijnen vormen van de serovar Enteritidis.
Vervolgens hebben we een vergelijkende genomics-analyse uitgevoerd met als doel genetische verschillen te identificeren die geassocieerd zijn met de lineages E1 en E2, waarbij 165 genomen zijn geïncludeerd: 57 uit Uruguay, 11 uit Argentinië en 97 uit Brazilië (Fig. 2(a)).
Allelische varianten tussen E1 en E2 lineages
Omdat we geen verschillen in accessoire genoom vonden tussen E1 en E2 lineages, zochten we naar SNP verschillen tussen de 165 geselecteerde stammen. Deze analyse toonde aan dat de belangrijkste verschillen tussen E1 en E2 gelegen zijn in drie genen: ycdX, pduD en hsdM. Deze genen zijn onderbroken in E1-genomen in vergelijking met hun tegenhangers in de E2-genen. Bovendien vonden we allelische varianten in andere vier genen, ybiO, yiaN, aas en aceA, die specifiek zijn voor elke lineage (Fig. 2(a,b); Tabel 1).
Alle 103 E1-stammen (11 uit Argentinië, 71 uit Brazilië en 21 uit Uruguay) vertonen een insertie van 4 basisparen in gen ycdX (SEN1912) in vergelijking met de referentie en alle E2-stammen (tabel 1). Deze insertie introduceert een voortijdig stopcodon, wat een pseudo-gen of een afgeknotte versie van het eiwit kan opleveren (Fig. 2(b) en Tabel 1). Het ycdX-gen codeert voor een hydrolase dat behoort tot de superfamilie van PHP-eiwitten, die een NH2-terminaal php-domein (polymerase histidinol fosfatase) bevatten. Dit domein is kenmerkend voor de DNA polymerase III alpha subeenheid van bacteriën en is betrokken bij de proofreading functie22. Er is gesuggereerd dat YcdX betrokken is bij de DNA reparatie pathways in E. coli en zou kunnen fungeren als een nuclease of een fosfatase in deze pathways23. Onlangs vonden Wang et al. twee allelische varianten voor dit gen (niet synonieme SNP) tussen S. enterica serovar Enteritidis isolaten met duidelijk verschillende capaciteiten om te overleven in eiwit24. Inoue et al. toonden aan dat mutatie in ycdY (het aangrenzende gen in het ycdWXYZ operon) onderdrukking van het zwermen in E. coli veroorzaakte25.
Alle stammen van de E2-lijn hebben dezelfde allelische variant voor het pduD-gen (SEN2039), terwijl 102 van de 103 stammen van de E1-lijn een basensubstitutie vertonen die een stopcodon introduceert, vergelijkbaar met die welke voor ycdX is waargenomen (tabel 1). Bij de resterende stam (d.w.z. 11/07 uit Uruguay) ontbreekt het pduD-gen volledig (Fig. 2(b) en Tabel 1). pduD codeert voor een propanedioldehydratase, een onderdeel van het pdu-operon dat codeert voor alle eiwitten die nodig zijn voor het 1,2-propaandiol katabolisme. Dit operon, dat door laterale genoverdracht bij Salmonella26,27 werd verworven, is verstoord bij verschillende serovars die invasieve extra-intestinale infecties bij de mens veroorzaken, zoals Typhi en Paratyphi A28. Faber et al. meldden dat de functionaliteit van dit operon belangrijk kan zijn om te concurreren met intestinale microbiota, aangezien 1,2 propanediol een stofwisselingsproduct in het anaërobe darmmilieu is dat door Salmonella kan worden gebruikt wanneer het wordt gekoppeld aan de tetrathionaat-anaërobe ademhaling29. Voorgesteld wordt dat het vermogen om 1,2 propanediol te gebruiken de uitbreiding van de pathogene populatie in de darm mogelijk maakt, waardoor de uitscheiding in de feces toeneemt, wat een belangrijke factor voor de verspreiding van epidemieën is29.
Verder hebben alle E2-stammen dezelfde allelische variant voor het hsdM-gen (SEN4290), maar onder de E1-stammen zijn er verschillende varianten voor dit gen (Fig. 2(b) en Tabel 1). De meeste E1-stammen bevatten varianten van hsdM die hetzij een afgeknotte versie (4 van de 6 varianten), hetzij een niet-synonieme substitutie voor het eiwit zouden opleveren. Slechts drie stammen in de E1 (waaronder de Uruguayaanse 44/07) hebben dezelfde variant als E2, wat suggereert dat alleen in E1-stammen hsdM vatbaar is voor accumulatie van mutaties (Fig. 2(b)). Het hsdM-gen codeert voor een DNA-methylase dat betrokken is bij het type I restrictie-modificatiesysteem (RM) in enterobacteriën30,31. Eerdere rapporten brachten restrictiemodificatiesystemen type 2 in verband met pathogeniciteit bij Salmonella als gevolg van epigenetische effecten op de expressie van virulentiegenen32. Silva et al. toonden aan dat mutaties in de RM genen een verstoord fenotype veroorzaken in het muismodel van invasieve salmonellose33. Type 1 RM systemen werden ook beschreven als betrokken bij de pathogeniciteit van Yersinia pseudotuberculosis34.
Gezien het feit dat E2 maar niet E1 intacte kopieën heeft van ycdX, pduD en hsdM, en gezien het feit dat deze genen eerder betrokken zijn geweest bij de pathogeniciteit van Salmonella, kan worden aangenomen dat deze drie genen van belang kunnen zijn voor het epidemisch vermogen van de E2 stammen. We zochten ook naar de allelische varianten in de globale fylogenie die de intra-serovar diversiteit vertegenwoordigt (Supplementary Fig. 1 en ref. 8) en vonden dat het overheersende allel in alle gevallen het E2 allel is, terwijl de verstoorde varianten specifiek zijn voor E1 (data not shown).
Zoals hierboven vermeld, werden nog vier genen ybiO, yiaN, aas en aceA gevonden met geringe sequentieverschillen tussen beide lineages. Deze vier genen vertonen een enkele variant in E2-stammen, terwijl E1 grotendeels identiek is aan referentiestam P125109.
Alle E2-stammen vertonen een bepaalde allelische variant van het ybiO-gen (SEN0772) als gevolg van een substitutie die een Gly(601)→Arg in het eiwit oplevert (Fig. 2(a,b), Tabel 1). Het ybiO-gen codeert voor een vermoedelijk mechanosensitief kanaaleiwit dat betrokken is bij osmotische adaptatie en dat geactiveerd wordt door hypo-osmotische shock in E. coli35. Eerder werd gemeld dat er twee allelische varianten voor dit gen bestaan onder S. enterica serovar Enteritidis isolaten die een verschillend vermogen hebben om te overleven in eiwit24. Voor yiaN (SEN3494) (L-dehydroascorbaat transporter large permease subunit, een putatief membraaneiwit) vertonen alle E2-genen hetzelfde allel dat in Gly(163)→Ala verschilt ten opzichte van E1. Evenzo hebben alle E2 dezelfde variant voor de genen aas (2-acylglycerofosfoëthanolamine-cyltransferase/acyl-ACP synthetase, SEN2853) en aceA (isocitraatlyase, SEN3966). In E1 hebben de meeste stammen een aas-gen dat identiek is aan het referentiegen, en enkele stammen hebben ofwel een niet-synonieme substitutie (5 stammen) of een synonieme substitutie (1 stam) (Fig. 2(a), Tabel 1). Evenzo is het aceA-gen identiek aan de referentie in alle E1-genomen op één na.
Samenvattend hebben we gevonden dat de E2-allelen voor ybiO, yiaN, aas en aceA specifiek zijn voor deze lijn.