Srovnávací genomika Salmonella enterica serovar Enteritidis ST-11 izolované v Uruguayi odhaluje linie spojené s určitými epidemiologickými znaky

Zář 15, 2021
admin

Srovnávací genomika

Nejprve jsme porovnali 61 uruguayských izolátů pomocí analýzy SNP s genomem P125109 jako referenčním. Tato analýza ukázala, že dva nejstarší izoláty mají více než 600 SNP rozdílů oproti referenčnímu genomu (607 a 652 pro 31/88 a 08/89), zatímco všech ostatních 59 izolátů má méně než dvě stě SNP (od 60 do 166) (doplňková tabulka 1). Na druhou stranu všechny uruguayské genomy sdílejí 17 SNP rozdílů s genomem P125109.

Fylogenetická analýza založená na SNP odhalila existenci dvou kladů, které jsme nazvali E1 a E2 (obr. 1b) a které zahrnují 57 z 61 kmenů. Těchto 57 kmenů patří k hlavnímu MLST sekvenčnímu typu 11 (ST-11) S. enterica serovar Enteritidis a v zemi spolucirkulují od roku 1994. Zbývající čtyři izoláty (31/88, 8/89, 77/02 a 89/02) se nezařadily do žádné ze dvou kladů (obr. 1b). Již dříve jsme uvedli, že dva nejstarší izoláty (31/88 a 8/89) patří k MLST sekvenčnímu typu 1974 (ST1974) a že ST1974 vznikl z ST11 po získání charakteristického profágu8. Další dva izoláty, 77/02 a 89/02, patří stejně jako většina kmenů k ST11.

Klade E1 zahrnuje 21 kmenů, které pokrývají všech pět epidemiologických období a byly izolovány z potravin, zvířat nebo lidských infekcí. Naopak klad E2 je zastoupen 36 izoláty, z nichž 34 bylo izolováno v obdobích spojených s epidemiemi (obr. 1(a,b)). Proto lze vyslovit hypotézu, že E2 může představovat linii, která byla zodpovědná za epidemie S. enterica serovar Enteritidis v zemi.

Předtím jsme uvedli fylogenetickou analýzu 203 kmenů, které reprezentují vnitroserovou diverzitu mezi izoláty S. enterica serovar Enteritidis EBG4 po celém světě, která zahrnovala 6 z 61 uruguayských izolátů použitých v této studii8. Jak jsme nyní zjistili, polovina z těchto 6 kmenů je E1 a polovina E2 (E1: 53/94, 206/99 a 214/02; E2: 8/02, 251/01 a 253/01) a každá z těchto dvou skupin je úzce příbuzná s kmeny z Evropy a Severní Ameriky. Tento vztah je znázorněn na doplňkovém obr. S1, který obsahuje dříve uváděnou fylogenezi se zvětšením na klad tvořený těmito kmeny. To naznačuje, že kmeny E1 a E2 mohou mít širokou cirkulaci.

Pro další podporu tohoto předpokladu jsme provedli novou fylogenetickou analýzu, tentokrát se zaměřením na kmeny izolované v regionu, včetně 12 kmenů z Argentiny, 122 kmenů z Brazílie a stejných 61 genomů z Uruguaye (obr. 2(a)). Zajímavé je, že jsme zjistili, že všechny tyto kmeny se shlukují velmi podobně, jako jsme zjistili mezi uruguayskými izoláty, tj. shluk E1 nyní obsahuje kmeny z Argentiny a Brazílie, zatímco shluk E2 obsahuje kmeny z Brazílie (103 v E1 a 62 v E2). Vzhledem k nízkému počtu genomů z Argentiny, které jsou k dispozici v databázi EnteroBase, nemůžeme vyloučit, že v této zemi cirkulovala linie E2. Pouze 30 kmenů ze všech tří zemí bylo seskupeno mimo E1 a E2, z nichž 24 bylo izolováno před rokem 1994 (obr. 2(a), doplňková tabulka 2). Celkově naše výsledky silně naznačují, že kmeny E1 a E2 byly do regionu zavlečeny kolem roku 1994 a od té doby cirkulují v Uruguayi, Brazílii, Argentině, Evropě a Severní Americe, což podporuje myšlenku, že oba kmeny představují linie sérovaru Enteritidis.

Obrázek 2
obrázek 2

(a) Fylogenetický strom 195 genomů zahrnující 61 z Uruguaye (bílé listy), 12 z Argentiny (světle modré listy) a 122 z Brazílie (žluté listy). Větve linie E1 jsou podbarveny modře. Větve linie E2 jsou vyznačeny červeně. Dráhy vpravo představují různými barvami alelické varianty pro ycdX, pduD, hsdM, ybiO, yiaN, aas a aceA. Viz barevné legendy uvnitř (b). Jednotky měřítka představují změny na jedno místo varianty. (b) Zarovnání genů pro různé alelické varianty ycdX, pduD, hsdM, ybiO, yiaN, aas a aceA v tomto pořadí. Geny jsou znázorněny tak, jak jsou anotovány v genomu obsahujícím každou variantu, a zarovnány k referenčnímu P125109. Měřítko zarovnání v párech bází (bp) je vyznačeno vodorovnými čarami. SNP spojené s každou variantou vzhledem k referenčnímu genomu jsou podrobně uvedeny v tabulce 1. SNP způsobující nesynonymní varianty jsou označeny jako X → Y (v jednopísmenném kódu aminokyseliny) vzhledem ke své pozici v genu. Synonymní SNP jsou označeny pouze vzhledem ke své pozici v genu (syn SNP).

Poté jsme provedli srovnávací genomickou analýzu zaměřenou na identifikaci genetických rozdílů spojených s liniemi E1 a E2, včetně 165 genomů: 57 z Uruguaye, 11 z Argentiny a 97 z Brazílie (obr. 2(a)).

Alelické varianty mezi liniemi E1 a E2

Jelikož jsme nenašli rozdíly v akcesorickém genomu mezi liniemi E1 a E2, hledali jsme rozdíly v SNP mezi 165 vybranými kmeny. Tato analýza ukázala, že hlavní rozdíly mezi E1 a E2 se nacházejí ve třech genech: ycdX, pduD a hsdM. Tyto geny jsou v genomech E1 přerušeny ve srovnání s jejich protějšky v genomech E2. Kromě toho jsme našli alelické varianty v dalších čtyřech genech, ybiO, yiaN, aas a aceA, které jsou specifické pro každou linii (obr. 2(a,b); tab. 1).

Tabulka 1 SNP a genové varianty 7 genových markerů pro linie E1 a E2.

Všech 103 kmenů E1 (11 z Argentiny, 71 z Brazílie a 21 z Uruguaye) vykazuje inzert 4 párů bází umístěný v genu ycdX (SEN1912) ve srovnání s referencí a se všemi kmeny E2 (tabulka 1). Tato inzerce zavádí předčasný stop kodon, což může vést ke vzniku pseudogenu nebo zkrácené verze proteinu (obr. 2b) a tabulka 1). Gen ycdX kóduje hydrolázu, která patří do nadrodiny proteinů PHP, které obsahují NH2-koncovou php doménu (polymerázová histidinolfosfatáza). Tato doména je charakteristická pro alfa podjednotku DNA polymerázy III bakterií a podílí se na funkci proofreadingu22. Předpokládá se, že YcdX je zapojena do opravných drah DNA u E. coli a mohla by v těchto drahách působit jako nukleáza nebo fosfatáza23. Nedávno Wang et al. zjistili dvě alelické varianty tohoto genu (nesynonymní SNP) mezi izoláty S. enterica serovar Enteritidis s výrazně odlišnou schopností přežívat ve vaječném bílku24. Inoue et al. prokázali, že mutace v genu ycdY (sousední gen v operonu ycdWXYZ) způsobuje potlačení rojení u E. coli25.

Všechny kmeny z linie E2 mají stejnou alelickou variantu pro gen pduD (SEN2039), zatímco 102 ze 103 kmenů z linie E1 vykazuje záměnu báze, která zavádí stop kodon, podobný tomu, který byl pozorován u ycdX (tab. 1). Zbývající kmen (tj. 11/07 z Uruguaye) zcela postrádá gen pduD (obr. 2b) a tab. 1). pduD kóduje propanedioldehydratázu, součást operonu pdu, který kóduje všechny potřebné proteiny pro katabolismus 1,2-propandiolu. Tento operon, který byl u salmonel získán laterálním přenosem genů26,27 , je narušen u různých sérovarů, které způsobují invazivní mimostřevní infekce u člověka, jako jsou mimo jiné Typhi a Paratyphi A28. Faber a kol. uvádějí, že funkčnost tohoto operonu může být důležitá pro soupeření se střevní mikroflórou, protože 1,2-propandiol je metabolický produkt v anaerobním střevním prostředí, který může být salmonelami využit ve spojení s anaerobní respirací tetrathionátu29. Předpokládá se, že schopnost využívat 1,2 propanediol umožňuje expanzi populace patogenu ve střevě zvyšující vylučování ve stolici, což je důležitý faktor pro šíření epidemie29.

Všechny kmeny E2 mají navíc stejnou alelickou variantu pro gen hsdM (SEN4290), ale mezi kmeny E1 existuje několik variant pro tento gen (obr. 2b) a tab. 1). Většina kmenů E1 obsahuje varianty genu hsdM, které by vytvářely buď zkrácenou verzi (4 ze 6 variant), nebo nesynonymní záměnu proteinu. Pouze tři kmeny v E1 (včetně uruguayského 44/07) mají stejnou variantu jako E2, což naznačuje, že pouze u kmenů E1 je hsdM náchylný ke kumulaci mutací (obr. 2b). Gen hsdM kóduje DNA metylázu zapojenou do restrikčně-modifikačního systému (RM) typu I u enterobakterií30,31 . Předchozí zprávy spojovaly restrikčně-modifikační systémy typu 2 s patogenitou u salmonel v důsledku epigenetických účinků na expresi genů virulence32. Silva et al. prokázali, že mutace v RM genech způsobují zhoršený fenotyp u myšího modelu invazivní salmonelózy33. Bylo také popsáno, že systémy RM typu 1 se podílejí na patogenitě Yersinia pseudotuberculosis34.

Vzhledem k tomu, že E2, ale ne E1, mají intaktní kopie ycdX, pduD a hsdM, a vzhledem k tomu, že tyto geny byly již dříve zapojeny do patogenity salmonel, lze mít za to, že tyto tři geny mohou mít význam pro epidemickou schopnost kmenů E2. Hledali jsme také alelické varianty v globální fylogenezi reprezentující vnitroserovarskou diverzitu (doplňkový obr. 1 a cit.8 ) a zjistili jsme, že převažující alelou je ve všech případech alela E2, zatímco narušené varianty jsou specifické pro E1 (údaje nejsou uvedeny).

Jak bylo uvedeno výše, byly nalezeny další čtyři geny ybiO, yiaN, aas a aceA s menšími sekvenčními rozdíly mezi oběma liniemi. Tyto čtyři geny představují jedinou variantu u kmenů E2, zatímco E1 jsou většinou shodné s referenčním kmenem P125109.

Všechny kmeny E2 představují zvláštní alelickou variantu genu ybiO (SEN0772) v důsledku substituce, která vytváří v proteinu Gly(601)→Arg (obr. 2(a,b), tab. 1). Gen ybiO kóduje předpokládaný mechanosenzitivní kanálový protein zapojený do osmotické adaptace, který je u E. coli aktivován hypoosmotickým šokem35. Již dříve bylo zjištěno, že mezi izoláty S. enterica serovar Enteritidis existují dvě alelické varianty tohoto genu, které mají rozdílnou schopnost přežívat ve vaječném bílku24. U genu yiaN (SEN3494) (velká podjednotka permeázy L-dehydroaskorbátového transportéru, předpokládaný membránový protein) se u všech genů E2 vyskytuje stejná alela, která se liší v Gly(163)→Ala oproti E1. Podobně mají všechny E2 stejnou variantu pro geny aas (2-acylglycerofosfoetanolamin acyltransferáza/acyl-ACP syntetáza, SEN2853) a aceA (isocitrát lyáza, SEN3966). U E1 má většina kmenů gen aas shodný s referenčním a několik kmenů vykazuje buď nesynonymní záměnu (5 kmenů), nebo synonymní záměnu (1 kmen) (obr. 2 a), tab. 1). Podobně je gen aceA identický s referenčním ve všech genomech E1 kromě jednoho.

Shrnem jsme zjistili, že alely E2 pro ybiO, yiaN, aas a aceA jsou specifické pro tuto linii.

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.