Comparative genomics of Salmonella enterica serovar Enteritidis ST-11 izolowanych w Urugwaju ujawnia linie rozwojowe związane z określonymi cechami epidemiologicznymi

wrz 15, 2021
admin

Genomika porównawcza

Początkowo porównaliśmy 61 izolatów urugwajskich przy użyciu analizy SNP z genomem P125109 jako odniesieniem. Analiza ta wykazała, że dwa najstarsze izolaty mają ponad 600 SNP różnic w porównaniu z genomem referencyjnym (607 i 652 odpowiednio dla 31/88 i 08/89), podczas gdy wszystkie pozostałe 59 izolatów ma mniej niż dwieście SNP (od 60 do 166) (Tabela uzupełniająca 1). Z drugiej strony, wszystkie genomy urugwajskie mają 17 SNP różniących się od genomu P125109.

Analiza filogenetyczna oparta na SNP ujawniła istnienie dwóch kladów, które nazwaliśmy E1 i E2 (Rys. 1(b)), które obejmują 57 z 61 szczepów. Te 57 szczepów należy do głównego gatunku S. enterica serovar Enteritidis MLST typu sekwencji 11 (ST-11) i współwystępuje w kraju od 1994 roku. Pozostałe cztery izolaty (31/88, 8/89, 77/02 i 89/02) nie grupowały się w żadnym z dwóch kladów (ryc. 1(b)). Wcześniej informowaliśmy, że dwa najstarsze izolaty (31/88 i 8/89) należą do typu sekwencji MLST 1974 (ST1974) i że ST1974 wywodzi się z ST11 po nabyciu charakterystycznego profaga8. Pozostałe dwa izolaty, 77/02 i 89/02, należą do ST11 jak większość szczepów.

Klada E1 obejmuje 21 szczepów, które obejmują wszystkie pięć okresów epidemiologicznych i zostały wyizolowane z żywności, zakażeń u zwierząt lub ludzi. Natomiast klad E2 jest reprezentowany przez 36 izolatów, z których 34 zostały wyizolowane w okresach związanych z epidemią (Ryc. 1(a,b)). Stąd uzasadniona jest hipoteza, że E2 może stanowić linię, która była odpowiedzialna za epidemie S. enterica serovar Enteritidis w tym kraju.

Poprzednio przedstawiliśmy analizę filogenetyczną 203 szczepów, reprezentujących różnorodność wewnątrzserowarową wśród izolatów S. enterica serovar Enteritidis EBG4 na całym świecie, która obejmowała 6 z 61 urugwajskich izolatów użytych w obecnym badaniu8. Jak stwierdziliśmy obecnie, połowa z tych 6 szczepów to E1, a połowa to E2 (E1: 53/94, 206/99 i 214/02; E2: 8/02, 251/01 i 253/01), a każda z tych dwóch grup jest blisko spokrewniona ze szczepami z Europy i Ameryki Północnej. Zależność ta została przedstawiona na Supplementary Fig. S1, zawierającym wcześniej opisaną filogenezę z powiększeniem na klad utworzony przez te szczepy. Sugeruje to, że E1 i E2 mogą mieć szeroki wzór krążenia.

W celu dalszego potwierdzenia tego przypuszczenia przeprowadziliśmy nową analizę filogenetyczną, tym razem skupiając się na szczepach izolowanych w regionie, w tym 12 z Argentyny, 122 z Brazylii i tych samych 61 genomach z Urugwaju (Rys. 2(a)). Co ciekawe, okazało się, że wszystkie te szczepy grupują się w sposób bardzo podobny do tego, co znaleźliśmy wśród izolatów urugwajskich, tj. klaster E1 zawiera teraz szczepy z Argentyny i Brazylii, podczas gdy klaster E2 zawiera szczepy z Brazylii (103 w E1 i 62 w E2). Biorąc pod uwagę niską liczbę genomów z Argentyny dostępnych w EnteroBase, nie możemy wykluczyć możliwości, że linia E2 krążyła w tym kraju. Tylko 30 szczepów ze wszystkich trzech krajów zgrupowano poza E1 i E2, z czego 24 wyizolowano przed 1994 rokiem (Ryc. 2(a), Tabela uzupełniająca 2). W sumie nasze wyniki silnie sugerują, że szczepy E1 i E2 zostały wprowadzone do tego regionu około 1994 roku i od tego czasu krążą w Urugwaju, Brazylii, Argentynie, Europie i Ameryce Północnej, wspierając ideę, że oba stanowią linie serologiczne serotypu Enteritidis.

Rysunek 2
figure2

(a) Drzewo filogenetyczne 195 genomów, w tym 61 z Urugwaju (białe liście), 12 z Argentyny (jasnoniebieskie liście) i 122 z Brazylii (żółte liście). Gałęzie linii E1 są pokolorowane na niebiesko. Odgałęzienia linii E2 zaznaczono na czerwono. Paski po prawej stronie przedstawiają różnymi kolorami warianty alleliczne odpowiednio dla ycdX, pduD, hsdM, ybiO, yiaN, aas i aceA. Zobacz legendę kolorów wewnątrz (b). Skala jednostek paska przedstawia zmiany na miejsce wariantu. (b) Wyrównanie genów dla różnych wariantów allelicznych odpowiednio ycdX, pduD, hsdM, ybiO, yiaN, aas i aceA. Geny są przedstawione w formie adnotacji w genomie zawierającym każdy wariant i wyrównane do referencyjnego P125109. Skala wyrównania w parach zasad (bp) jest oznaczona poziomymi paskami. SNPs związane z każdym wariantem w odniesieniu do genomu referencyjnego są wyszczególnione w Tabeli 1. SNP powodujące warianty nie synonimiczne są oznaczone jako X → Y (w jednoliterowym kodzie aminokwasowym) w odniesieniu do ich pozycji w genie. Synonimiczne SNPs są oznaczone tylko względem jego pozycji w genie (syn SNP).

Następnie przeprowadziliśmy analizę genomiki porównawczej, której celem była identyfikacja różnic genetycznych związanych z liniami E1 i E2, obejmującą 165 genomów: 57 z Urugwaju, 11 z Argentyny i 97 z Brazylii (ryc. 2(a)).

Warianty alleliczne wśród linii E1 i E2

Ponieważ nie znaleźliśmy różnic w genomie akcesoryjnym między liniami E1 i E2, szukaliśmy różnic SNP wśród 165 wybranych szczepów. Analiza ta wykazała, że główne różnice pomiędzy E1 i E2 zlokalizowane są w trzech genach: ycdX, pduD i hsdM. Geny te są zaburzone w genomach E1 w porównaniu do ich odpowiedników w genomach E2. Ponadto, znaleźliśmy warianty alleliczne w innych czterech genach, ybiO, yiaN, aas i aceA, które są specyficzne dla każdej linii (Rys. 2(a,b); Tabela 1).

Tabela 1 SNPs i warianty genowe markerów 7 genów dla linii E1 i E2.

Wszystkie 103 szczepy E1 (11 z Argentyny, 71 z Brazylii i 21 z Urugwaju) wykazują insercję o długości 4 par zasad zlokalizowaną w genie ycdX (SEN1912) w porównaniu z referencją i wszystkimi szczepami E2 (Tabela 1). Insercja ta wprowadza przedwczesny kodon stop, co może prowadzić do powstania pseudogenu lub okrojonej wersji białka (Rys. 2(b) i Tabela 1). Gen ycdX koduje hydrolazę należącą do nadrodziny białek PHP, które zawierają NH2-końcową domenę php (polimerase histidinol phosphatase). Domena ta jest charakterystyczna dla podjednostki alfa polimerazy DNA III bakterii i jest zaangażowana w funkcję proofreadingu22. Sugeruje się, że YcdX jest zaangażowany w szlaki naprawy DNA u E. coli i może działać jako nukleaza lub fosfataza w tych szlakach23. Ostatnio Wang i wsp. znaleźli dwa warianty alleliczne dla tego genu (non synonymous SNP) pomiędzy izolatami S. enterica serovar Enteritidis o wyraźnie różnych zdolnościach do przeżycia w białku jaja24. Inoue i wsp. wykazali, że mutacja w ycdY (sąsiedni gen w operonie ycdWXYZ) powoduje represję rojenia u E. coli25.

Wszystkie szczepy z linii E2 posiadają ten sam wariant alleliczny dla genu pduD (SEN2039), natomiast 102 ze 103 szczepów z linii E1 wykazuje substytucję zasad wprowadzającą kodon stop, podobną do obserwowanej dla ycdX (Tabela 1). Pozostały szczep (tj. 11/07 z Urugwaju) całkowicie pozbawiony jest genu pduD (Rys. 2(b) i Tabela 1). pduD koduje dehydratazę propanediolową, część operonu pdu, który koduje wszystkie białka wymagane do katabolizmu 1,2-propanediolu. Operon ten, uzyskany w wyniku bocznego transferu genów w Salmonella26,27 , jest zaburzony w różnych serotypach wywołujących inwazyjne zakażenia pozajelitowe u ludzi, takich jak między innymi Typhi i Paratyphi A28. Faber i wsp. stwierdzili, że funkcjonalność tego operonu może być istotna dla konkurowania z mikrobiotą jelitową, ponieważ 1,2 propanediol jest produktem przemiany materii w beztlenowym środowisku jelitowym, który może być wykorzystywany przez Salmonella, gdy jest sprzężony z beztlenowym oddychaniem tetrationianowym29. Proponuje się, że zdolność do wykorzystania 1,2 propanediolu pozwala na ekspansję populacji patogenu w jelicie zwiększając wydalanie w kale, co jest ważnym czynnikiem rozprzestrzeniania się epidemii29.

Więcej, wszystkie szczepy E2 mają ten sam wariant alleliczny dla genu hsdM (SEN4290), ale wśród szczepów E1 jest kilka wariantów dla tego genu (Rys. 2(b) i Tabela 1). Większość szczepów E1 zawiera warianty hsdM, które produkowałyby albo wersję skróconą (4 z 6 wariantów) albo substytucję nie synonimiczną dla białka. Tylko trzy szczepy w E1 (w tym urugwajski 44/07) mają taki sam wariant jak E2, co sugeruje, że tylko w szczepach E1 hsdM jest podatny na akumulację mutacji (Rys. 2(b)). Gen hsdM koduje metylazę DNA zaangażowaną w system modyfikacji restrykcyjnej (RM) typu I u enterobakterii30,31. Wcześniejsze doniesienia wiązały systemy modyfikacji restrykcji typu 2 z patogennością u Salmonella ze względu na epigenetyczny wpływ na ekspresję genów wirulencji32. Silva i wsp. wykazali, że mutacje w genach RM powodują upośledzenie fenotypu w mysim modelu inwazyjnej salmonellozy33. Systemy RM typu 1 zostały również opisane jako zaangażowane w patogenność Yersinia pseudotuberculosis34.

Biorąc pod uwagę, że E2, ale nie E1, mają nienaruszone kopie ycdX, pduD i hsdM, a także biorąc pod uwagę, że te geny zostały wcześniej zaangażowane w patogenność Salmonelli, można przyjąć, że sugerują, że te trzy geny mogą być istotne dla zdolności epidemicznej szczepów E2. Szukaliśmy również wariantów allelicznych w globalnej filogenezie reprezentującej różnorodność wewnątrzserowarową (Supplementary Fig. 1 i ref. 8) i stwierdziliśmy, że dominującym allelem jest allel E2 we wszystkich przypadkach, podczas gdy zaburzone warianty są specyficzne dla E1 (dane nie pokazane).

Jak wspomniano powyżej, inne cztery geny ybiO, yiaN, aas i aceA zostały znalezione z niewielkimi różnicami sekwencji między obiema liniami. Te cztery geny wykazują pojedyncze warianty w szczepach E2, podczas gdy E1 są w większości identyczne ze szczepem referencyjnym P125109.

Wszystkie szczepy E2 wykazują szczególny wariant alleliczny genu ybiO (SEN0772) spowodowany substytucją, która wytwarza Gly(601)→Arg w białku (Rys. 2(a,b), Tabela 1). Gen ybiO koduje białko kanału mechanosensytywnego zaangażowanego w adaptację osmotyczną, który jest aktywowany przez szok hipo-osmotyczny u E. coli35. Wcześniej donoszono, że wśród izolatów S. enterica serovar Enteritidis istnieją dwa warianty alleliczne dla tego genu, które różnią się zdolnością do przeżycia w białku jaja24. Dla yiaN (SEN3494) (duża podjednostka permeazowa transportera L-dehydroaskorbinianu, putatywne białko błonowe) wszystkie genomy E2 prezentują ten sam allel, który różni się w Gly(163)→Ala w stosunku do E1. Podobnie, wszystkie E2 posiadają ten sam wariant dla genów aas (acyltransferaza 2-acyloglicerofosforoetanoloaminy/syntetaza acylo-ACP, SEN2853) i aceA (liaza izocytrynianowa, SEN3966). W E1 większość szczepów posiada gen aas identyczny z referencyjnym, a kilka szczepów posiada substytucję nie synonimiczną (5 szczepów) lub synonimiczną (1 szczep) (Rys. 2(a), Tabela 1). Podobnie, gen aceA jest identyczny z referencją we wszystkich genomach E1 z wyjątkiem jednego.

Podsumowując, stwierdziliśmy, że allele E2 dla ybiO, yiaN, aas i aceA są specyficzne dla tej linii.

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.