Vergleichende Genomik von Salmonella enterica serovar Enteritidis ST-11, isoliert in Uruguay, zeigt Abstammungslinien, die mit bestimmten epidemiologischen Merkmalen assoziiert sind
Vergleichende Genomik
Zunächst verglichen wir die 61 Isolate aus Uruguay mittels SNP-Analyse mit dem Genom P125109 als Referenz. Diese Analyse zeigte, dass die beiden ältesten Isolate mehr als 600 SNPs Unterschied zum Referenzgenom aufweisen (607 und 652 für 31/88 bzw. 08/89), während alle anderen 59 Isolate weniger als zweihundert SNPs aufweisen (von 60 bis 166) (ergänzende Tabelle 1). Andererseits unterscheiden sich alle uruguayischen Genome in 17 SNPs vom P125109-Genom.
Eine phylogenetische Analyse auf der Grundlage von SNPs ergab die Existenz von zwei Kladen, die wir E1 und E2 nannten (Abb. 1(b)) und die 57 der 61 Stämme umfassen. Diese 57 Stämme gehören zum wichtigsten S. enterica serovar Enteritidis MLST-Sequenztyp 11 (ST-11) und zirkulieren seit 1994 im Land. Die übrigen vier Isolate (31/88, 8/89, 77/02 und 89/02) ließen sich keiner der beiden Kladen zuordnen (Abb. 1(b)). Wir haben bereits berichtet, dass die beiden ältesten Isolate (31/88 und 8/89) zum MLST-Sequenztyp 1974 (ST1974) gehören und dass ST1974 nach dem Erwerb eines charakteristischen Prophagen aus ST11 entstanden ist8. Die beiden anderen Isolate, 77/02 und 89/02, gehören wie die Mehrheit der Stämme zu ST11.
Die E1-Klade umfasst 21 Stämme, die alle fünf epidemiologischen Zeiträume abdecken und aus Lebensmitteln, Tier- oder Humaninfektionen isoliert wurden. Die E2-Gruppe hingegen besteht aus 36 Isolaten, von denen 34 in den mit den Epidemien verbundenen Zeiträumen isoliert wurden (Abb. 1(a,b)). Daher liegt die Vermutung nahe, dass E2 eine Linie darstellt, die für die S. enterica serovar Enteritidis-Epidemien im Land verantwortlich war.
Vor kurzem berichteten wir über eine phylogenetische Analyse von 203 Stämmen, die die Intra-Serovar-Vielfalt unter den S. enterica serovar Enteritidis EBG4-Isolaten weltweit repräsentieren, darunter 6 der 61 uruguayischen Isolate, die in der vorliegenden Studie verwendet wurden8. Wie wir jetzt herausgefunden haben, gehören die Hälfte dieser 6 Stämme zu E1 und die andere Hälfte zu E2 (E1: 53/94, 206/99 und 214/02; E2: 8/02, 251/01 und 253/01), und jede dieser beiden Gruppen ist eng mit Stämmen aus Europa und Nordamerika verwandt. Diese Beziehung ist in der ergänzenden Abbildung S1 dargestellt, die die zuvor gemeldete Phylogenie mit einer Vergrößerung der von diesen Stämmen gebildeten Klade enthält. Dies deutet darauf hin, dass E1 und E2 ein breites Verbreitungsmuster haben.
Um diese Annahme weiter zu untermauern, führten wir eine neue phylogenetische Analyse durch, diesmal mit Schwerpunkt auf Stämmen, die in der Region isoliert wurden, darunter 12 aus Argentinien, 122 aus Brasilien und die gleichen 61 Genome aus Uruguay (Abb. 2(a)). Interessanterweise stellten wir fest, dass all diese Stämme in einer sehr ähnlichen Weise geclustert wurden wie die Isolate aus Uruguay, d. h. Cluster E1 enthält nun Stämme aus Argentinien und Brasilien, während Cluster E2 Stämme aus Brasilien enthält (103 in E1 und 62 in E2). Angesichts der geringen Anzahl von Genomen aus Argentinien, die in EnteroBase verfügbar sind, können wir nicht ausschließen, dass die Linie E2 in diesem Land zirkulierte. Nur 30 Stämme aus allen drei Ländern wurden außerhalb von E1 und E2 gruppiert, von denen 24 vor 1994 isoliert wurden (Abb. 2(a), ergänzende Tabelle 2). Alles in allem deuten unsere Ergebnisse stark darauf hin, dass E1- und E2-Stämme um 1994 in die Region eingeführt wurden und seitdem in Uruguay, Brasilien, Argentinien, Europa und Nordamerika zirkulieren, was die Idee unterstützt, dass beide Linien des Serovar Enteritidis darstellen.
Anschließend führten wir eine vergleichende Genomanalyse durch, um genetische Unterschiede zwischen den Linien E1 und E2 zu ermitteln, die 165 Genome umfasste: 57 aus Uruguay, 11 aus Argentinien und 97 aus Brasilien (Abb. 2(a)).
Allelische Varianten zwischen den E1- und E2-Linien
Da wir keine Unterschiede im akzessorischen Genom zwischen den E1- und E2-Linien gefunden haben, haben wir nach SNP-Unterschieden zwischen den 165 ausgewählten Stämmen gesucht. Diese Analyse zeigte, dass die Hauptunterschiede zwischen E1 und E2 in drei Genen zu finden sind: ycdX, pduD und hsdM. Diese Gene sind in den E1-Genomen im Vergleich zu ihren Gegenstücken in den E2-Genomen unterbrochen. Darüber hinaus fanden wir allelische Varianten in anderen vier Genen, ybiO, yiaN, aas und aceA, die für jede Linie spezifisch sind (Abb. 2(a,b); Tabelle 1).
Alle 103 E1-Stämme (11 aus Argentinien, 71 aus Brasilien und 21 aus Uruguay) weisen eine Insertion von 4 Basenpaaren im Gen ycdX (SEN1912) auf, verglichen mit der Referenz und allen E2-Stämmen (Tabelle 1). Diese Insertion führt ein vorzeitiges Stoppcodon ein, das zu einem Pseudogen oder einer verkürzten Version des Proteins führen kann (Abb. 2(b) und Tabelle 1). Das ycdX-Gen kodiert eine Hydrolase, die zur Superfamilie der PHP-Proteine gehört, die eine NH2-terminale php-Domäne (Polymerase-Histidinol-Phosphatase) enthalten. Diese Domäne ist charakteristisch für die Alpha-Untereinheit der DNA-Polymerase III von Bakterien und ist an der Korrekturlesefunktion beteiligt22. Es wurde vermutet, dass YcdX an den DNA-Reparaturwegen in E. coli beteiligt ist und als Nuklease oder Phosphatase in diesen Wegen wirken könnte23. Kürzlich fanden Wang et al. zwei allelische Varianten für dieses Gen (nicht synonymer SNP) zwischen S. enterica serovar Enteritidis-Isolaten mit deutlich unterschiedlichen Fähigkeiten zum Überleben in Eiweiß24. Inoue et al. zeigten, dass eine Mutation in ycdY (dem benachbarten Gen im ycdWXYZ-Operon) eine Unterdrückung des Schwarmverhaltens in E. coli verursacht25.
Alle Stämme der E2-Linie haben dieselbe allelische Variante für das pduD-Gen (SEN2039), während 102 der 103 Stämme der E1-Linie eine Basensubstitution aufweisen, die ein Stoppcodon einführt, ähnlich wie bei ycdX (Tabelle 1). Dem verbleibenden Stamm (d. h. 11/07 aus Uruguay) fehlt das pduD-Gen vollständig (Abb. 2(b) und Tabelle 1). pduD kodiert für eine Propandiol-Dehydratase, die Teil des pdu-Operons ist, das für alle für den 1,2-Propandiol-Katabolismus erforderlichen Proteine kodiert. Dieses Operon, das durch lateralen Gentransfer in Salmonella26,27 erworben wurde, ist in verschiedenen Serovaren, die invasive extra-intestinale Infektionen beim Menschen verursachen, wie Typhi und Paratyphi A, gestört28. Faber et al. berichteten, dass die Funktionalität dieses Operons wichtig sein kann, um mit der Darmmikrobiota zu konkurrieren, da 1,2-Propandiol ein Stoffwechselprodukt in der anaeroben Darmumgebung ist, das von Salmonellen genutzt werden kann, wenn es an die anaerobe Tetrathionatatmung gekoppelt ist29. Es wird angenommen, dass die Fähigkeit, 1,2-Propandiol zu nutzen, die Expansion der Erregerpopulation im Darm ermöglicht und die Ausscheidung im Kot erhöht, was ein wichtiger Faktor für die epidemische Verbreitung ist29.
Außerdem haben alle E2-Stämme die gleiche allelische Variante für das hsdM-Gen (SEN4290), aber unter den E1-Stämmen gibt es mehrere Varianten für dieses Gen (Abb. 2(b) und Tabelle 1). Die meisten E1-Stämme enthalten Varianten von hsdM, die entweder eine verkürzte Version (4 der 6 Varianten) oder eine nicht synonyme Substitution des Proteins ergeben. Nur drei E1-Stämme (einschließlich des uruguayischen 44/07) weisen die gleiche Variante wie E2 auf, was darauf hindeutet, dass hsdM nur in E1-Stämmen für die Akkumulation von Mutationen anfällig ist (Abb. 2(b)). Das hsdM-Gen kodiert eine DNA-Methylase, die am Restriktionsmodifikationssystem (RM) vom Typ I in Enterobakterien beteiligt ist30,31. In früheren Berichten wurde ein Zusammenhang zwischen Restriktionsmodifikationssystemen vom Typ 2 und der Pathogenität von Salmonellen hergestellt, und zwar aufgrund epigenetischer Auswirkungen auf die Expression von Virulenzgenen32. Silva et al. zeigten, dass Mutationen in den RM-Genen einen beeinträchtigten Phänotyp im Mausmodell der invasiven Salmonellose hervorrufen33. RM-Systeme des Typs 1 wurden auch als an der Pathogenität von Yersinia pseudotuberculosis beteiligt beschrieben34.
Angesichts der Tatsache, dass E2, nicht aber E1, intakte Kopien von ycdX, pduD und hsdM aufweist, und in Anbetracht der Tatsache, dass diese Gene bereits früher mit der Pathogenität von Salmonella in Verbindung gebracht wurden, kann davon ausgegangen werden, dass diese drei Gene für die epidemische Fähigkeit der E2-Stämme von Bedeutung sein könnten. Wir haben auch nach den allelischen Varianten in der globalen Phylogenie gesucht, die die Intra-Serovar-Diversität repräsentiert (ergänzende Abb. 1 und ref. 8), und festgestellt, dass das vorherrschende Allel in allen Fällen das E2-Allel ist, während die gestörten Varianten spezifisch für E1 sind (Daten nicht gezeigt).
Wie oben erwähnt, wurden vier weitere Gene ybiO, yiaN, aas und aceA mit geringfügigen Sequenzunterschieden zwischen beiden Linien gefunden. Diese vier Gene weisen in den E2-Stämmen eine einzige Variante auf, während die E1-Stämme größtenteils mit dem Referenzstamm P125109 identisch sind.
Alle E2-Stämme weisen eine bestimmte allelische Variante des ybiO-Gens (SEN0772) auf, die auf eine Substitution zurückzuführen ist, die ein Gly(601)→Arg im Protein erzeugt (Abb. 2(a,b), Tabelle 1). Das ybiO-Gen kodiert für ein mutmaßlich mechanosensitives Kanalprotein, das an der osmotischen Anpassung beteiligt ist und durch einen hypo-osmotischen Schock in E. coli aktiviert wird35. Es wurde bereits berichtet, dass es unter den Isolaten von S. enterica serovar Enteritidis zwei allelische Varianten dieses Gens gibt, die sich in ihrer Fähigkeit, in Eiweiß zu überleben, unterscheiden24. Für yiaN (SEN3494) (L-Dehydroascorbat-Transporter große Permease-Untereinheit, ein putatives Membranprotein) weisen alle E2-Genome das gleiche Allel auf, das sich in Gly(163)→Ala von E1 unterscheidet. Ebenso weisen alle E2 die gleiche Variante für die Gene aas (2-Acylglycerophosphoethanolamin-Acyltransferase/Acyl-ACP-Synthetase, SEN2853) und aceA (Isocitratlyase, SEN3966) auf. In E1 haben die meisten Stämme ein aas-Gen, das mit der Referenz identisch ist, und einige wenige Stämme weisen entweder eine nicht synonyme Substitution (5 Stämme) oder eine synonyme Substitution (1 Stamm) auf (Abb. 2(a), Tabelle 1). Ebenso ist das aceA-Gen in allen E1-Genomen bis auf eines mit der Referenz identisch.
Zusammenfassend haben wir festgestellt, dass die E2-Allele für ybiO, yiaN, aas und aceA spezifisch für diese Linie sind.