Genômica comparativa de Salmonella enterica serovar Enteritidis ST-11 isolados no Uruguai revela linhagens associadas a traços epidemiológicos particulares

Set 15, 2021
admin

Genômica comparativa

Primeiro comparamos os 61 isolados uruguaios usando a análise SNP com o genoma P125109 como referência. Esta análise mostrou que os dois isolados mais antigos têm mais de 600 SNPs de diferença em relação ao genoma de referência (607 e 652 para 31/88 e 08/89 respectivamente), enquanto todos os outros 59 isolados têm menos de duzentos SNPs (de 60 a 166) (Tabela Suplementar 1). Por outro lado, todos os genomas uruguaios compartilham 17 SNPs de diferença com o genoma P125109.

Uma análise filogenética baseada nos SNPs revelou a existência de dois clades que denominamos E1 e E2 (Fig. 1(b)) que compreendem 57 das 61 cepas. Estas 57 cepas pertencem à grande S. enterica serovar Enteritidis MLST tipo 11 (ST-11) e têm co-circulado no país desde 1994. Os quatro isolados restantes (31/88, 8/89, 77/02 e 89/02) não se agruparam com nenhuma das duas clades (Fig. 1(b)). Relatamos anteriormente que os dois isolados mais antigos (31/88 e 8/89) pertencem à seqüência MLST tipo 1974 (ST1974) e que o ST1974 originou-se do ST11 após a aquisição de um prófago característico8. Os outros dois isolados, 77/02 e 89/02, pertencem ao ST11 como a maioria das linhagens.

O clade E1 compreende 21 linhagens que abrangem todos os cinco períodos epidemiológicos, e foram isoladas de infecções alimentares, animais ou humanas. Em vez disso, o clade E2 é representado por 36 isolados dos quais 34 foram isolados nos períodos associados a epidemias (Fig. 1(a,b)). Portanto, é razoável supor que o E2 possa constituir uma linhagem responsável pela epidemia de S. enterica serovar Enteritidis no país.

Anteriormente relatamos uma análise filogenética de 203 linhagens, representando a diversidade intra-serovar entre os isolados de S. enterica serovar Enteritidis EBG4 em todo o mundo, que incluiu 6 dos 61 isolados uruguaios utilizados no presente estudo8. Como encontramos agora, metade dessas 6 cepas são E1 e metade são E2 (E1: 53/94, 206/99 e 214/02; E2: 8/02, 251/01 e 253/01), e cada um desses dois grupos está intimamente relacionado com cepas da Europa e da América do Norte. Esta relação é mostrada na Fig. S1 Complementar, contendo a filogenia previamente relatada com um zoom sobre o clade formado por estas cepas. Isto sugere que E1 e E2 podem ter um amplo padrão de circulação.

Para apoiar ainda mais esta suposição, fizemos uma nova análise filogenética, desta vez com foco em cepas isoladas na região, incluindo 12 da Argentina, 122 do Brasil e os mesmos 61 genomas do Uruguai (Fig. 2(a)). Curiosamente, descobrimos que todas essas cepas se agruparam de forma muito semelhante ao que encontramos entre os isolados uruguaios, ou seja, o cluster E1 agora contém cepas da Argentina e do Brasil enquanto o cluster E2 contém cepas do Brasil (103 no E1, e 62 no E2). Dado o baixo número de genomas da Argentina disponíveis no EnteroBase, não podemos excluir a possibilidade de que a linhagem E2 estivesse circulando neste país. Apenas 30 linhagens dos três países agrupados fora de E1 e E2, das quais 24 foram isoladas antes de 1994 (Fig. 2(a), Tabela Complementar 2). Todos os nossos resultados sugerem fortemente que as linhagens E1 e E2 foram introduzidas na região ao redor de 1994 e têm circulado desde então no Uruguai, Brasil, Argentina, Europa e América do Norte, apoiando a idéia de que ambas constituem linhagens do serovar Enteritidis.

>

Figure 2
>figure2

(a) Árvore filogenética dos 195 genomas incluindo 61 do Uruguai (folhas brancas), 12 da Argentina (folhas azuis claras) e 122 do Brasil (folhas amarelas). Os ramos da linhagem E1 são coloridos em azul. Os ramos da linhagem E2 são indicados em vermelho. As faixas à direita representam com cores diferentes as variantes alélicas para ycdX, pduD, hsdM, ybiO, yiaN, aas e aceA respectivamente. Veja as legendas das cores dentro da (b). As unidades de barra de escala representam as mudanças por local de variante. (b) Alinhamentos genéticos para as diferentes variantes alélicas de ycdX, pduD, hsdM, ybiO, yiaN, aas e aceA, respectivamente. Os genes são representados como anotados no genoma contendo cada variante e alinhados com a referência P125109. A escala do alinhamento em pares de bases (bp) é indicada por barras horizontais. Os SNPs associados a cada variante em relação ao genoma de referência estão detalhados na Tabela 1. Os SNPs que causam variantes não sinônimas são marcados como X → Y (em código de aminoácidos de letra única) em relação à sua posição no gene. Os SNPs sinônimos são marcados apenas em relação à sua posição no gene (syn SNP).

Realizamos então uma análise genômica comparativa com o objetivo de identificar diferenças genéticas associadas às linhagens E1 e E2, incluindo 165 genomas: 57 do Uruguai, 11 da Argentina e 97 do Brasil (Fig. 2(a)).

Variantes alélicas entre as linhagens E1 e E2

Como não encontramos diferenças no genoma acessório entre as linhagens E1 e E2, procuramos diferenças de SNP entre as 165 linhagens selecionadas. Esta análise mostrou que as principais diferenças entre E1 e E2 estão localizadas em três genes: ycdX, pduD e hsdM. Estes genes são interrompidos nos genomas E1 quando comparados com os seus homólogos nos genomas E2. Além disso, encontramos variantes alélicas em outros quatro genes, ybiO, yiaN, aas e aceA, que são específicos para cada linhagem (Fig. 2(a,b); Tabela 1).

Tabela 1 SNPs e variantes gênicas dos 7 marcadores de genes para as linhagens E1 e E2.

Todas as 103 linhagens E1 (11 da Argentina, 71 do Brasil e 21 do Uruguai) mostram uma inserção de 4 pares de bases localizadas no gene ycdX (SEN1912) em comparação com a referência e com todas as linhagens E2 (Tabela 1). Esta inserção introduz um códon de parada prematura, que pode produzir um pseudo-gene ou uma versão truncada da proteína (Fig. 2(b) e Tabela 1). O gene ycdX codifica uma hidrolase que pertence à superfamília das proteínas PHP, que contém um domínio php terminal NH2 (polimerase histidinol fosfatase). Este domínio é característico da subunidade alfa de bactérias DNA polimerase III e está envolvido na função de revisão22. Tem sido sugerido que a YcdX está envolvida nas vias de reparação do ADN na E. coli e pode actuar como nuclease ou fosfátase nestas vias23. Recentemente, Wang et al. encontraram duas variantes alélicas para este gene (SNP não sinônimo) entre S. enterica serovar Enteritidis isolados com habilidades marcadamente diferentes para sobreviver na clara do ovo24. Inoue et al. mostraram que a mutação em ycdY (o gene adjacente no operon ycdWXYZ) causou a repressão da enxameação em E. coli25.

Todas as linhagens da linhagem E2 têm a mesma variante alélica para o gene pduD (SEN2039) enquanto 102 das 103 linhagens da linhagem E1 mostram uma substituição de base que introduz um códon de parada, semelhante ao observado para ycdX (Tabela 1). A estirpe restante (i.e. 11/07 do Uruguai) carece completamente do gene pduD (Fig. 2(b) e Tabela 1). codificadores pduD para uma desidratase de propanodiol, parte do operon pdu que codifica todas as proteínas necessárias para o catabolismo 1,2-propanodiol. Este ópero que foi adquirido por transferência de genes laterais em Salmonella26,27 é perturbado em diferentes serovares que causam infecções extraintestinais invasivas em humanos como Typhi e Paratyphi A, entre outros28. Faber et al. relataram que a funcionalidade deste ópero pode ser importante para competir com a microbiota intestinal, pois 1,2 propanodiol é um produto metabólico no ambiente do intestino anaeróbico que pode ser usado pela Salmonella quando acoplado à respiração anaeróbica tetrathionate29. Propõe-se que a capacidade de usar 1,2 propanodiol permita a expansão da população patogênica no intestino aumentando a excreção nas fezes, o que é um fator importante para disseminação epidêmica29,

Outras vezes, todas as cepas E2 têm a mesma variante alélica para o gene hsdM (SEN4290), mas entre as cepas E1 existem várias variantes para este gene (Fig. 2(b) e Tabela 1). A maioria das cepas E1 contém variantes do hsdM que produziriam uma versão truncada (4 das 6 variantes) ou uma substituição não sinônima para a proteína. Apenas três cepas na E1 (incluindo a 44/07 Uruguaia) têm a mesma variante da E2, sugerindo que apenas nas cepas E1 a hsdM é propensa a acumular mutações (Fig. 2(b)). O gene hsdM codifica uma metilase de DNA envolvida no sistema de modificação de restrição (RM) tipo I em enterobactérias30,31. Relatos anteriores relacionaram sistemas de modificação de restrição tipo 2 com patogenicidade em Salmonella devido a efeitos epigenéticos na expressão do gene de virulência32. Silva et al. mostraram que mutações nos genes RM produzem um fenótipo comprometido no modelo de salmonelose invasiva do rato33. Sistemas de RM tipo 1 também foram descritos como envolvidos na patogenicidade da pseudotuberculose de Yersinia34,

Dado que E2 mas não E1 têm cópias intactas de ycdX, pduD e hsdM, e considerando que estes genes foram previamente implicados na patogenicidade da Salmonella, pode-se tomar como base para sugerir que estes três genes podem ser relevantes para a capacidade epidêmica das cepas de E2. Também procuramos as variantes alélicas na filogenia global representando a diversidade intra-serovar (Figura Suplementar 1 e ref. 8) e encontramos que o alelo predominante é o alelo E2 em todos os casos, enquanto as variantes perturbadas são específicas para o E1 (dados não mostrados).

Como mencionado acima, outros quatro genes ybiO, yiaN, aas e aceA foram encontrados com pequenas diferenças de seqüência entre as duas linhagens. Esses quatro genes apresentam uma única variante nas linhagens E2, enquanto E1 são na sua maioria idênticos à linhagem de referência P125109.

Todas as linhagens E2 apresentam uma variante alélica particular do gene ybiO (SEN0772) devido a uma substituição que produz um Gly(601)→Arg na proteína (Fig. 2(a,b), Tabela 1). O codificador do gene ybiO para uma suposta proteína de canal mechanosensível envolvida na adaptação osmótica que é ativada pelo choque hipoosmótico na E. coli35. Foi relatado anteriormente que existem duas variantes alélicas para este gene entre os isolados de S. enterica serovar Enteritidis que têm diferentes capacidades de sobrevivência na clara do ovo24. Para yiaN (SEN3494) (L-dehydroascorbate transporter large permease subunit, uma proteína de membrana putativa) todos os genomas de E2 apresentam o mesmo alelo que difere em Gly(163)→Ala em relação ao E1. Da mesma forma, todos os E2 compartilham a mesma variante para os genes aas (2-acylglycerophosphoethanolamine acyltransferase/acyl-ACP synthetase, SEN2853) e aceA (isocitrate lyase, SEN3966). Em E1, a maioria das cepas tem um gene aas idêntico ao de referência, e algumas cepas apresentam ou uma substituição não sinônima (5 cepas) ou uma substituição sinônima (1 cepa) (Fig. 2(a), Tabela 1). Da mesma forma, o gene aceA é idêntico à referência em todos os genomas E1, exceto um.

Em resumo, encontramos que os alelos E2 para ybiO, yiaN, aas e aceA são específicos para esta linhagem.

Deixe uma resposta

O seu endereço de email não será publicado.