La genómica comparativa de Salmonella enterica serovar Enteritidis ST-11 aislado en Uruguay revela linajes asociados a rasgos epidemiológicos particulares

Sep 15, 2021
admin

Genómica comparativa

Primero comparamos los 61 aislados uruguayos utilizando el análisis de SNP con el genoma P125109 como referencia. Este análisis mostró que los dos aislados más antiguos tienen más de 600 SNPs de diferencia en comparación con el genoma de referencia (607 y 652 para 31/88 y 08/89 respectivamente), mientras que los otros 59 aislados tienen menos de doscientos SNPs (de 60 a 166) (Tabla Suplementaria 1). Por otra parte, todos los genomas uruguayos comparten 17 SNPs de diferencia con el genoma de P125109.

Un análisis filogenético basado en los SNPs reveló la existencia de dos clados que denominamos E1 y E2 (Fig. 1(b)) que comprenden 57 de las 61 cepas. Estas 57 cepas pertenecen al principal tipo de secuencia MLST de S. enterica serovar Enteritidis (ST-11) y han estado circulando en el país desde 1994. Los cuatro aislados restantes (31/88, 8/89, 77/02 y 89/02) no se agruparon con ninguno de los dos clados (Fig. 1(b)). Anteriormente informamos de que los dos aislados más antiguos (31/88 y 8/89) pertenecen al tipo de secuencia MLST 1974 (ST1974) y que ST1974 se originó a partir de ST11 tras la adquisición de un profago característico8. Los otros dos aislados, 77/02 y 89/02, pertenecen al ST11 como la mayoría de las cepas.

El clado E1 comprende 21 cepas que abarcan los cinco periodos epidemiológicos, y fueron aisladas de infecciones alimentarias, animales o humanas. En cambio, el clado E2 está representado por 36 cepas, de las cuales 34 se aislaron en los periodos asociados a las epidemias (Fig. 1(a,b)). Por lo tanto, es razonable hipotetizar que E2 puede constituir un linaje que fue responsable de las epidemias de S. enterica serovar Enteritidis en el país.

Previamente reportamos un análisis filogenético de 203 cepas, representando la diversidad intra-serovar entre los aislamientos de S. enterica serovar Enteritidis EBG4 en todo el mundo, que incluyó 6 de los 61 aislamientos uruguayos utilizados en el presente estudio8. Como hemos encontrado ahora, la mitad de estas 6 cepas son E1 y la otra mitad son E2 (E1: 53/94, 206/99 y 214/02; E2: 8/02, 251/01 y 253/01), y cada uno de estos dos grupos está estrechamente relacionado con las cepas de Europa y Norteamérica. Esta relación se muestra en la Fig. Suplementaria S1, que contiene la filogenia previamente reportada con un zoom en el clado formado por estas cepas. Esto sugiere que E1 y E2 pueden tener un amplio patrón de circulación.

Para apoyar aún más esta suposición realizamos un nuevo análisis filogenético, esta vez centrado en cepas aisladas en la región, incluyendo 12 de Argentina, 122 de Brasil y los mismos 61 genomas de Uruguay (Fig. 2(a)). Curiosamente, encontramos que todas estas cepas se agrupan de forma muy similar a lo que encontramos entre los aislados uruguayos, es decir, el cluster E1 contiene ahora cepas de Argentina y Brasil mientras que el cluster E2 contiene cepas de Brasil (103 en E1, y 62 en E2). Dado el bajo número de genomas de Argentina disponibles en EnteroBase, no podemos excluir la posibilidad de que el linaje E2 estuviera circulando en este país. Sólo 30 cepas de los tres países se agruparon fuera de E1 y E2, de las cuales 24 fueron aisladas antes de 1994 (Fig. 2(a), Tabla Suplementaria 2). En conjunto, nuestros resultados sugieren fuertemente que las cepas E1 y E2 fueron introducidas en la región alrededor de 1994 y han estado circulando desde entonces en Uruguay, Brasil, Argentina, Europa y Norteamérica, apoyando la idea de que ambas constituyen linajes del serovar Enteritidis.

Figura 2
figura2

(a) Árbol filogenético de los 195 genomas que incluye 61 de Uruguay (hojas blancas), 12 de Argentina (hojas azul claro) y 122 de Brasil (hojas amarillas). Las ramas del linaje E1 están coloreadas en azul. Las ramas del linaje E2 se indican en rojo. Los carriles de la derecha representan con diferentes colores las variantes alélicas para ycdX, pduD, hsdM, ybiO, yiaN, aas y aceA respectivamente. Véanse las leyendas de color dentro de (b). Las unidades de la barra de escala representan los cambios por sitio de la variante. (b) Alineaciones de genes para las diferentes variantes alélicas de ycdX, pduD, hsdM, ybiO, yiaN, aas y aceA respectivamente. Los genes se representan tal y como están anotados en el genoma que contiene cada variante y alineados con la referencia P125109. La escala del alineamiento en pares de bases (pb) se indica con barras horizontales. Los SNPs asociados a cada variante respecto al genoma de referencia se detallan en la Tabla 1. Los SNPs que causan variantes no sinónimas están marcados como X → Y (en código de aminoácidos de una sola letra) respecto a su posición en el gen. Los SNPs sinónimos sólo se marcan en relación a su posición en el gen (syn SNP).

A continuación, realizamos un análisis genómico comparativo destinado a identificar las diferencias genéticas asociadas a los linajes E1 y E2, incluyendo 165 genomas: 57 de Uruguay, 11 de Argentina y 97 de Brasil (Fig. 2(a)).

Variantes alélicas entre los linajes E1 y E2

Como no encontramos diferencias en el genoma accesorio entre los linajes E1 y E2, buscamos diferencias de SNP entre las 165 cepas seleccionadas. Este análisis mostró que las principales diferencias entre E1 y E2 se localizan en tres genes: ycdX, pduD y hsdM. Estos genes están interrumpidos en los genomas E1 en comparación con sus homólogos en los genomas E2. Además, encontramos variantes alélicas en otros cuatro genes, ybiO, yiaN, aas y aceA, que son específicos para cada linaje (Fig. 2(a,b); Tabla 1).

Tabla 1 SNPs y variantes génicas de los 7 genes marcadores para los linajes E1 y E2.

Todas las 103 cepas E1 (11 de Argentina, 71 de Brasil y 21 de Uruguay) muestran una inserción de 4 pares de bases localizada en el gen ycdX (SEN1912) en comparación con la referencia y con todas las cepas E2 (Tabla 1). Esta inserción introduce un codón de parada prematuro, que puede producir un pseudogén o una versión truncada de la proteína (Fig. 2(b) y Tabla 1). El gen ycdX codifica una hidrolasa que pertenece a la superfamilia de proteínas PHP, que contienen un dominio php NH2-terminal (polimerasa histidinol fosfatasa). Este dominio es característico de la subunidad alfa de la ADN polimerasa III de las bacterias y está implicado en la función de corrección de pruebas22. Se ha sugerido que YcdX participa en las vías de reparación del ADN en E. coli y podría actuar como una nucleasa o una fosfatasa en estas vías23. Recientemente, Wang et al. encontraron dos variantes alélicas para este gen (SNP no sinónimo) entre los aislados de S. enterica serovar Enteritidis con capacidades marcadamente diferentes para sobrevivir en la clara de huevo24. Inoue et al. demostraron que la mutación en ycdY (el gen adyacente en el operón ycdWXYZ) causaba la represión del enjambre en E. coli25.

Todas las cepas del linaje E2 tienen la misma variante alélica para el gen pduD (SEN2039), mientras que 102 de las 103 cepas del linaje E1 muestran una sustitución de bases que introduce un codón de parada, similar a la observada para ycdX (Tabla 1). La cepa restante (11/07 de Uruguay) carece por completo del gen pduD (Fig. 2(b) y Tabla 1). pduD codifica para una propanediol deshidratasa, parte del operón pdu que codifica todas las proteínas necesarias para el catabolismo del 1,2-propanediol. Este operón, que se adquirió por transferencia lateral de genes en Salmonella26,27, está alterado en diferentes serovares que causan infecciones extraintestinales invasivas en humanos, como Typhi y Paratyphi A, entre otros28. Faber et al. informaron de que la funcionalidad de este operón puede ser importante para competir con la microbiota intestinal, ya que el 1,2 propanediol es un producto metabólico en el entorno intestinal anaeróbico que puede ser utilizado por Salmonella cuando se acopla a la respiración anaeróbica del tetratión29. Se propone que la capacidad de utilizar el 1,2 propanediol permite la expansión de la población de patógenos en el intestino aumentando la excreción en las heces, lo cual es un factor importante para la diseminación epidémica29.

Además, todas las cepas E2 tienen la misma variante alélica para el gen hsdM (SEN4290) pero entre las cepas E1 hay varias variantes para este gen (Fig. 2(b) y Tabla 1). La mayoría de las cepas E1 contienen variantes de hsdM que producirían una versión truncada (4 de las 6 variantes) o una sustitución no sinónima de la proteína. Sólo tres cepas del E1 (incluyendo la uruguaya 44/07) tienen la misma variante que el E2, lo que sugiere que sólo en las cepas E1 hsdM es propensa a acumular mutaciones (Fig. 2(b)). El gen hsdM codifica una metilasa de ADN implicada en el sistema de modificación de restricción (MR) de tipo I en las enterobacterias30,31. Informes anteriores relacionaban los sistemas de modificación de la restricción tipo 2 con la patogenicidad en Salmonella debido a los efectos epigenéticos sobre la expresión de los genes de virulencia32. Silva et al. demostraron que las mutaciones en los genes de MR producen un fenotipo alterado en el modelo de ratón de salmonelosis invasiva33. También se ha descrito que los sistemas RM de tipo 1 están implicados en la patogenicidad de Yersinia pseudotuberculosis34.

Dado que E2, pero no E1, tiene copias intactas de ycdX, pduD y hsdM, y teniendo en cuenta que estos genes se han implicado previamente en la patogenicidad de Salmonella, se puede considerar que estos tres genes pueden ser relevantes para la capacidad epidémica de las cepas E2. También buscamos las variantes alélicas en la filogenia global que representa la diversidad intra-serovar (Fig. suplementaria 1 y ref. 8) y encontramos que el alelo predominante es el alelo E2 en todos los casos, mientras que las variantes alteradas son específicas de E1 (datos no mostrados).

Como se ha mencionado anteriormente, se encontraron otros cuatro genes ybiO, yiaN, aas y aceA con diferencias de secuencia menores entre ambos linajes. Estos cuatro genes presentan una única variante en las cepas E2 mientras que las E1 son en su mayoría idénticas a la cepa de referencia P125109.

Todas las cepas E2 presentan una variante alélica particular del gen ybiO (SEN0772) debido a una sustitución que produce una Gly(601)→Arg en la proteína (Fig. 2(a,b), Tabla 1). El gen ybiO codifica para una putativa proteína de canal mecanosensible implicada en la adaptación osmótica que se activa con el choque hipoosmótico en E. coli35. Anteriormente se informó de que existen dos variantes alélicas para este gen entre los aislados de S. enterica serovar Enteritidis que tienen diferente capacidad para sobrevivir en la clara de huevo24. Para yiaN (SEN3494) (subunidad de la permeasa del transportador de L-dehidroascorbato, una proteína de membrana putativa) todos los genomas E2 presentan el mismo alelo que difiere en Gly(163)→Ala respecto a E1. Del mismo modo, todas las E2 comparten la misma variante para los genes aas (acilglicerofosfotanolamina aciltransferasa/acyl-ACP sintetasa, SEN2853) y aceA (isocitrato liasa, SEN3966). En E1, la mayoría de las cepas tienen un gen aas idéntico al de referencia, y unas pocas cepas presentan una sustitución no sinónima (5 cepas) o una sustitución sinónima (1 cepa) (Fig. 2(a), Tabla 1). Del mismo modo, el gen aceA es idéntico a la referencia en todos los genomas E1 menos en uno.

En resumen, encontramos que los alelos E2 para ybiO, yiaN, aas y aceA son específicos para este linaje.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.