Genomica comparativa di Salmonella enterica serovar Enteritidis ST-11 isolati in Uruguay rivela lignaggi associati a particolari tratti epidemiologici
Genomica comparativa
Prima abbiamo confrontato i 61 isolati uruguaiani utilizzando l’analisi SNP con il genoma P125109 come riferimento. Questa analisi ha mostrato che i due isolati più vecchi hanno più di 600 SNPs di differenza rispetto al genoma di riferimento (607 e 652 per 31/88 e 08/89 rispettivamente), mentre tutti gli altri 59 isolati hanno meno di duecento SNPs (da 60 a 166) (Tabella 1 supplementare). D’altra parte, tutti i genomi uruguaiani condividono 17 SNPs di differenza con il genoma P125109.
Un’analisi filogenetica basata sugli SNPs ha rivelato l’esistenza di due cladi che abbiamo chiamato E1 ed E2 (Fig. 1(b)) che comprendono 57 dei 61 ceppi. Questi 57 ceppi appartengono al principale tipo di sequenza MLST 11 (ST-11) di S. enterica serovar Enteritidis e sono in circolazione nel paese dal 1994. I restanti quattro isolati (31/88, 8/89, 77/02 e 89/02) non si sono raggruppati con nessuno dei due cladi (Fig. 1(b)). Abbiamo precedentemente riportato che i due isolati più vecchi (31/88 e 8/89) appartengono al tipo di sequenza MLST 1974 (ST1974) e che ST1974 si è originato da ST11 dopo l’acquisizione di un profago caratteristico8. Gli altri due isolati, 77/02 e 89/02, appartengono a ST11 come la maggioranza dei ceppi.
Il clade E1 comprende 21 ceppi che abbracciano tutti e cinque i periodi epidemiologici, e sono stati isolati da infezioni alimentari, animali o umane. Invece, il clade E2 è rappresentato da 36 isolati di cui 34 sono stati isolati nei periodi associati alle epidemie (Fig. 1(a,b)). Quindi, è ragionevole ipotizzare che E2 possa costituire un lignaggio responsabile delle epidemie di S. enterica serovar Enteritidis nel paese.
In precedenza abbiamo riportato un’analisi filogenetica di 203 ceppi, che rappresentano la diversità intra-serovar tra S. enterica serovar Enteritidis EBG4 isolati in tutto il mondo, che includeva 6 dei 61 isolati uruguayani utilizzati nel presente studio8. Come abbiamo trovato ora, metà di questi 6 ceppi sono E1 e metà sono E2 (E1: 53/94, 206/99 e 214/02; E2: 8/02, 251/01 e 253/01), e ciascuno di questi due gruppi è strettamente correlati con ceppi provenienti da Europa e Nord America. Questa relazione è mostrata nella Fig. S1 supplementare, che contiene la filogenesi precedentemente riportata con uno zoom sul clade formato da questi ceppi. Questo suggerisce che E1 e E2 possono avere un ampio modello di circolazione.
Al fine di sostenere ulteriormente questa ipotesi abbiamo eseguito una nuova analisi filogenetica, questa volta con focus in ceppi isolati nella regione, tra cui 12 dall’Argentina, 122 dal Brasile e gli stessi 61 genomi dall’Uruguay (Fig. 2(a)). È interessante notare che tutti questi ceppi si sono raggruppati in modo molto simile a quello che abbiamo trovato tra gli isolati uruguaiani, cioè il cluster E1 ora contiene ceppi dall’Argentina e dal Brasile mentre il cluster E2 contiene ceppi dal Brasile (103 in E1, e 62 in E2). Dato il basso numero di genomi dall’Argentina disponibili in EnteroBase, non possiamo escludere la possibilità che il lineage E2 circolasse in questo paese. Solo 30 ceppi di tutti e tre i paesi si sono raggruppati al di fuori di E1 e E2, di cui 24 sono stati isolati prima del 1994 (Fig. 2(a), Tabella supplementare 2). Nel complesso i nostri risultati suggeriscono fortemente che i ceppi E1 ed E2 sono stati introdotti nella regione intorno al 1994 e da allora circolano in Uruguay, Brasile, Argentina, Europa e Nord America, sostenendo l’idea che entrambi costituiscono lignaggi della serovar Enteritidis.
Abbiamo quindi eseguito un’analisi genomica comparativa volta a identificare le differenze genetiche associate ai lignaggi E1 ed E2, tra cui 165 genomi: 57 dall’Uruguay, 11 dall’Argentina e 97 dal Brasile (Fig. 2(a)).
Varianti alleliche tra le stirpi E1 ed E2
Non avendo trovato differenze nel genoma accessorio tra le stirpi E1 ed E2, abbiamo cercato differenze SNP tra i 165 ceppi selezionati. Questa analisi ha mostrato che le principali differenze tra E1 ed E2 si trovano in tre geni: ycdX, pduD e hsdM. Questi geni sono interrotti nei genomi E1 rispetto alle loro controparti nei genomi E2. Inoltre, abbiamo trovato varianti alleliche in altri quattro geni, ybiO, yiaN, aas e aceA, che sono specifici per ogni stirpe (Fig. 2(a,b); Tabella 1).
Tutti i 103 ceppi E1 (11 dall’Argentina, 71 dal Brasile e 21 dall’Uruguay) mostrano un’inserzione di 4 coppie di basi situata nel gene ycdX (SEN1912) rispetto al riferimento e a tutti i ceppi E2 (Tabella 1). Questa inserzione introduce un codone di stop prematuro, che può produrre uno pseudo-gene o una versione troncata della proteina (Fig. 2(b) e Tabella 1). Il gene ycdX codifica un’idrolasi che appartiene alla superfamiglia delle proteine PHP, che contengono un dominio NH2-terminale php (istidinol fosfatasi polimerasi). Questo dominio è caratteristico della subunità alfa della DNA polimerasi III dei batteri ed è coinvolto nella funzione di proofreading22. È stato suggerito che YcdX è coinvolto nelle vie di riparazione del DNA in E. coli e potrebbe agire come una nucleasi o una fosfatasi in queste vie23. Recentemente, Wang et al. hanno trovato due varianti alleliche per questo gene (SNP non sinonimi) tra isolati di S. enterica serovar Enteritidis con capacità marcatamente diverse di sopravvivere nell’albume24. Inoue et al. hanno dimostrato che la mutazione in ycdY (il gene adiacente nell’operone ycdWXYZ) ha causato la repressione della sciamatura in E. coli25.
Tutti i ceppi della stirpe E2 hanno la stessa variante allelica per il gene pduD (SEN2039) mentre 102 dei 103 ceppi della stirpe E1 mostrano una sostituzione di base che introduce un codone di stop, simile a quello osservato per ycdX (tabella 1). Il ceppo rimanente (cioè 11/07 dall’Uruguay) manca completamente del gene pduD (Fig. 2(b) e Tabella 1). pduD codifica per una propandiolo deidratasi, parte dell’operone pdu che codifica tutte le proteine necessarie per il catabolismo dell’1,2-propandiolo. Questo operone, acquisito tramite trasferimento genico laterale in Salmonella26,27 , è interrotto in diversi serovar che causano infezioni invasive extraintestinali nell’uomo, come Typhi e Paratyphi A tra gli altri28. Faber et al. hanno riferito che la funzionalità di questo operone può essere importante per competere con il microbiota intestinale, poiché l’1,2 propandiolo è un prodotto metabolico nell’ambiente intestinale anaerobico che può essere utilizzato da Salmonella quando è accoppiato alla respirazione anaerobica tetrathionate29. Si propone che la capacità di utilizzare 1,2 propandiolo permetta l’espansione della popolazione del patogeno nell’intestino aumentando l’escrezione nelle feci, che è un fattore importante per la diffusione epidemica29.
Inoltre, tutti i ceppi E2 hanno la stessa variante allelica per il gene hsdM (SEN4290) ma tra i ceppi E1 ci sono diverse varianti per questo gene (Fig. 2(b) e Tabella 1). La maggior parte dei ceppi E1 contiene varianti di hsdM che produrrebbero o una versione troncata (4 delle 6 varianti) o una sostituzione non sinonima della proteina. Solo tre ceppi nell’E1 (incluso il 44/07 uruguaiano) hanno la stessa variante dell’E2, suggerendo che solo nei ceppi E1 hsdM è incline ad accumulare mutazioni (Fig. 2(b)). Il gene hsdM codifica una metilasi del DNA coinvolto nel sistema di restrizione-modificazione di tipo I (RM) in enterobatteri30,31. Rapporti precedenti collegati sistemi di modifica restrizione tipo 2 con patogenicità in Salmonella a causa di effetti epigenetici sull’espressione del gene virulenza32. Silva et al. hanno dimostrato che le mutazioni nei geni RM producono un fenotipo alterato nel modello murino di salmonellosi invasiva33. I sistemi RM di tipo 1 sono stati anche descritti come coinvolti nella patogenicità di Yersinia pseudotuberculosis34.
Visto che E2 ma non E1 hanno copie intatte di ycdX, pduD e hsdM, e considerando che questi geni sono stati precedentemente implicati nella patogenicità di Salmonella, si può pensare che questi tre geni possano essere rilevanti per la capacità epidemica dei ceppi E2. Abbiamo anche cercato le varianti alleliche nella filogenesi globale che rappresenta la diversità intra-serovar (Fig. 1 supplementare e rif. 8) e abbiamo trovato che l’allele predominante è l’allele E2 in tutti i casi, mentre le varianti interrotte sono specifiche per E1 (dati non mostrati).
Come detto sopra, altri quattro geni ybiO, yiaN, aas e aceA sono stati trovati con differenze di sequenza minori tra entrambi i lignaggi. Questi quattro geni presentano una singola variante nei ceppi E2 mentre gli E1 sono per lo più identici al ceppo di riferimento P125109.
Tutti i ceppi E2 presentano una particolare variante allelica del gene ybiO (SEN0772) dovuta a una sostituzione che produce un Gly(601)→Arg nella proteina (Fig. 2(a,b), Tabella 1). Il gene ybiO codifica per una proteina putativa canale meccanosensibile coinvolto nell’adattamento osmotico che viene attivato da shock ipo-osmotico in E. coli35. È stato precedentemente segnalato che ci sono due varianti alleliche per questo gene tra S. enterica serovar Enteritidis isolati che hanno diversa capacità di sopravvivere in albume d’uovo24. Per yiaN (SEN3494) (L-deidroascorbato transporter grande subunità permeasi, una proteina di membrana putativa) tutti i genomi E2 presentano lo stesso allele che differisce in Gly(163)→Ala rispetto a E1. Allo stesso modo, tutti gli E2 condividono la stessa variante per i geni aas (2-acylglycerophosphoethanolamine acyltransferase/acyl-ACP synthetase, SEN2853) e aceA (isocitrate lyase, SEN3966). In E1, la maggior parte dei ceppi ha un gene aas identico al riferimento, e alcuni ceppi presentano una sostituzione non sinonima (5 ceppi) o una sostituzione sinonima (1 ceppo) (Fig. 2(a), Tabella 1). Allo stesso modo, il gene aceA è identico al riferimento in tutti i genomi E1 tranne uno.
In sintesi, abbiamo trovato che gli alleli E2 per ybiO, yiaN, aas e aceA sono specifici per questa stirpe.