El SARS-CoV-2 es un virus que está mutando y cada alteración trae consigo nuevas preguntas. Por esa razón, un científico de la Facultad de Microbiología de la Universidad de Costa Rica (UCR) aplica dos herramientas muy específicas para conocer a profundidad los cambios de este enemigo: la bioinformática y la inteligencia artificial.
Su nombre es José Arturo Molina Mora y él, junto con otros dos virólogos de la UCR que apoyan en la interpretación de datos (Eugenia Corrales Aguilar y Andrés Moreira Soto), efectúan esta labor con un único objetivo: identificar patrones del virus para reforzar la vigilancia epidemiológica.
El trabajo de estos científicos apoya el quehacer del Instituto Costarricense de Investigación y Enseñanza en Nutrición y Salud (Inciensa), que desde marzo de 2020 es el ente oficial encargado de liderar el análisis genómico del SARS-CoV-2 en el país.
La unión de ambas instituciones ha permitido descifrar la existencia de hasta once mutaciones que en estos momentos están circulando en el territorio nacional, y se estima que en un futuro próximo podrían presentarse nuevas. La pregunta es: ¿qué significa esto? ¿Es la circulación de otras cepas del virus un hecho para preocuparse?
Para el Dr. Molina, microbiólogo bioinformático del Centro de Investigación en Enfermedades Tropicales (CIET) de la Facultad de Microbiología, y coordinador del proyecto desde la UCR, la respuesta aún es incierta.
Por ese motivo, este especialista decidió abrir un espacio de su agenda para contestar esas interrogantes y además hablar sobre cómo la Universidad se vinculó al Inciensa, la contribución proporcionada para el diseño del protocolo de análisis, las razones científicas del porqué se están dando estas mutaciones y las proyecciones que se tienen sobre el virus.
-Dr. Molina, antes de ir a los detalles sobre las mutaciones del SARS-CoV-2, me gustaría saber cómo comenzó la participación de la UCR en el análisis genómico del virus y la vinculación con el Inciensa.
JMM: "Desde que China publicó el genoma del virus, en la UCR ya se estaba trabajando en su análisis para saber si el SARS-CoV-2 fue creado en un laboratorio.
Ahí corroboramos los estudios internacionales que hablaban de la existencia de otros virus que tenían una igualdad al SARS-CoV-2 del 96 %, un porcentaje suficiente para indicar que este nuevo virus respiratorio venía de la naturaleza. Con ese 96 % de identidad (similitud), era bastante para saber que el virus estaba circulando en animales y brincó al ser humano.
Para encontrar lo anterior generamos un protocolo. Poco tiempo después, cuando el virus llegó al país, el Inciensa empezó a secuenciar datos y vimos la oportunidad de unir lo que tienen ellos (infraestructura y capacidad para recibir las muestras) con nuestra área de bioinformática que es, básicamente, el análisis. Es decir, leer de manera masiva toda la molécula de ARN del virus".
-¿En qué consistió ese protocolo que la UCR ayudó a crear y que luego se convirtió en la piedra angular para el Inciensa?
JMM: "Consistió en crear una “receta” estandarizada y específica para Costa Rica. Debido a que no existen protocolos únicos y universales para este tipo de datos, se recomienda analizar los datos de forma específica, pues el método debe responder a variables de un lugar determinado y, por lo tanto, no aplica para todos los datos por igual.
Es como que una receta internacional indique que para hornear un pan se requiere dorar a 350 grados por 30 minutos, pero de repente mi horno es un poco diferente. Entonces, hay que moldear esas variables para el análisis. Lo que hicimos fue crear nuestra propia receta".
-Entonces, podríamos decir que tenemos un protocolo 100 % costarricense. ¿Cuál ha sido el principal aporte al país?
JMM: "El protocolo propio evita errores de análisis e interpretación. Un protocolo no estandarizado nos puede dar falsas mutaciones y hasta asociarse erróneamente con una mayor mortalidad en los pacientes. Por esa razón, estandarizamos una serie de parámetros para correr los algoritmos según los datos del Inciensa, tener alta calidad en los resultados y así interpretar de manera correcta.
En ese protocolo nos basamos en tres ingredientes principales. El primero fue la secuenciación del genoma, leer todo el material genético del virus. El virus consta de 29 903 letras (nucleótidos), que constituyen el mensaje genético del SARS-CoV-2.
El segundo ingrediente, y el más importante, fue el control de calidad de datos y de los análisis para tener resultados confiables. Por último, se contempló el contexto epidemiológico de posibles relaciones para interpretar y, eventualmente, tomar decisiones en la vigilancia de casos de COVID-19".
-¿A qué se refiere con un contexto de posibles relaciones?
JMM: "Cuando se habla de posibles relaciones se hace mención a la línea de contagio. Esta línea es única y cada lugar tiene su propia historia, por lo que es vital en la vigilancia epidemiológica.
Por ejemplo, si nos comparamos con un asiático, usted y yo vamos a tener un ADN más parecido. Eso mismo pasa con los virus. Si no sé cuál es el origen de un genoma, pero la secuencia es más cercana o parecida a casos de personas americanas, es posible que usted se contagiara de otra persona de América y no de una de Asia. En el rastreo epidemiológico esto es clave".
-En el caso costarricense, ¿cómo se determina esa línea de contagio?
JMM: "Para determinar esa línea de contagio se analiza si la secuencia A del virus de una persona es parecida a la secuencia B que tiene otro paciente. Si esas dos secuencias están relacionadas, podría ser que A fue el contacto de B, o viceversa. Si no es así, una secuencia de buena calidad ayuda a saber de dónde proviene el virus.
Además de lo anterior, también hemos documentado la mortalidad para saber si una variedad o mutación específica del virus genera una enfermedad más grave en los pacientes. En otras palabras, si una cepa del virus mata más que otra.
Dichos insumos son requeridos por el Ministerio de Salud a la hora de tomar decisiones para efectuar medidas más restrictivas. Esto, en caso de presentarse una variedad más agresiva del virus en una provincia o lugar específico".
El equipo de investigación de la UCR conformado por el Dr. Molina, la Dra. Corrales-Aguilar y el Dr. Andrés Moreira Soto trabaja en buscar e interpretar patrones genómicos del virus y clínico-demográficos de los pacientes. La idea es identificar si alguna mutación del virus está asociada con una mayor gravedad o posibilidad de fallecimiento.
-¿Y qué han visto hasta ahora?, ¿hay alguna mutación específica del SARS-CoV-2 vinculada a una mayor tasa de mortalidad en los pacientes?
JMM: "Los casos de Costa Rica ya tienen mutaciones suficientes para diferenciarse del virus originario de Wuhan y esto mismo está pasando en otras partes del mundo. Afortunadamente, no hemos encontrado una mutación que eleve la tasa de mortalidad en los pacientes.
Con base en los datos obtenidos hasta ahora, ni en Costa Rica ni en el mundo hay una mutación o tipo viral que sea más agresiva que otra. Por lo tanto, no se les asocia ninguna condición de mayor severidad. La proyección parece que no va a presentar ninguna diferencia, pero podría darse una excepción.
Conforme pasa el tiempo, el SARS-CoV-2 seguirá mutando y una de esas mutaciones podría volverse más agresiva. La idea es continuar con este tipo de análisis y darnos cuenta de lo que causa una variedad específica del virus, ya sea una muy poca mortalidad o, al contrario, una enfermedad más grave en las personas".
-Si bien usted indicó que ninguna mutación ha hecho que el virus sea más agresivo, ¿hay algunas mutaciones específicas que en este momento predominen en Costa Rica y estén tomando fuerza?
JMM: "En nuestro caso particular, hay dos mutaciones interesantes que han sido muy analizadas a nivel mundial. El primero está en la espícula S-614, la partícula del virus que interactúa con el ser humano y que es dominante. Luego, está el ORF8 en la posición 84, que es poco frecuente.
El virus original de Wuhan tiene una D en su posición S-614. Hemos identificado dos casos en Costa Rica que tenían una D, pero la mayoría cambiaron a una G; es decir, el virus mutó. Actualmente, la mayoría de los casos de Costa Rica tiene esa mutación G y esto mismo se observa en el mundo.
Un grupo de genomas con esta mutación se empezó a fortalecer en el mes de julio. Algunas publicaciones hablan de que la mutación G se podría asociar a una mayor cantidad de virus en la sangre. Ante esto, se creía que a mayor cantidad de virus más grave sería la enfermedad, pero esta suposición parece descartarse. A nivel clínico, no hemos visto asociación entre mutación y severidad".
-Según el último reporte del Inciensa, un total de 70 genomas virales en Costa Rica han sido analizados y se encontraron entre cuatro a once alteraciones por genoma. ¿La cantidad de alteraciones en el SARS-CoV-2 podría aumentar?
JMM: "Sí. Desde el último informe ya hemos analizado 140 genomas. Hemos encontrado preliminarmente cuatro mutaciones adicionales (para un total de 15) y conforme pasen los meses se registrarán más. Vamos en un aumento gradual lento y eso es esperable. En algunos años podríamos hasta encontrar 100 o más mutaciones".
-Cuando usted dice que en algunos años podríamos encontrar hasta 100 mutaciones, ¿se refiere a que dichas variantes se van acumulando en el tiempo?
JMM: "Correcto. En el camino el virus va arrastrando esas mutaciones y gana nuevas. Por lo general, la presencia de nuevas mutaciones son una señal positiva, porque quiere decir que el virus poco a poco se adapta al humano para continuar su replicación sin matar a su hospedero".
-En dicho proceso, ¿qué tan probable es que, de repente, se encuentre una mutación más agresiva?
JMM: "Puede suceder pero no es esperable que aumenten las mutaciones que hagan al virus más agresivo. Normalmente los patógenos se atenúan con el tiempo. Sin embargo, puede darse que en una de esas mutaciones el SARS-CoV-2 sea más virulento y dé lugar a una enfermedad más fuerte. Justo por eso es importante la vigilancia y el trabajo que desarrollamos desde la UCR".
- Dr. Molina, ¿y cuál es la razón científica del porqué estas mutaciones están sucediendo ¿Es el mismo ser humano quien las genera cuando el virus entra al organismo?
JMM: "Sí. Las mutaciones se originan conforme el virus pasa entre las personas. Esto es producto de errores que comete el virus al replicarse en las células humanas. Es como que yo le dicte a usted una oración de casi 30 000 letras. La posibilidad de equivocarse cuando yo le dicte la oración es alta. Lo mismo pasa con el SARS-CoV-2 que tiene las 29 903 letras que le dije antes.
Entonces, el virus llega a la célula humana para replicarse, le saca copia a su material genético y en ese proceso se puede equivocar. La mutación resultante puede hacer que el virus tenga un mayor éxito para diseminarse o, en cambio, inducir una enfermedad más grave".
-En la última conferencia de prensa del 02 de octubre el Dr. Francisco Duarte, del Inciensa, mencionó que estos cambios o mutaciones son pocas para el corto tiempo de existencia que tiene el virus.
JMM: "Así es. Que en siete meses de pandemia el virus solo se haya equivocado 15 veces (mutado), es una tasa bastante baja con todas las personas que ha infectado.
Por eso decimos que es muy lento. Los virus tienen mecanismos muy específicos para evitar mutaciones o “errores” en su copiado. Incluso, nosotros tenemos eso cuando nuestras células se dividen. No obstante, este virus es tan nuevo que hay que seguirlo vigilando.
Otro aspecto importante que también deseo mencionar, es que esas mutaciones no han ocurrido en los sitios de detección del virus".
-¿A qué se refiere con que no han ocurrido en los sitios de detección?
JMM: "El SARS-CoV-2 tiene casi 30 000 pares de letras, pero en el PCR solo se lee un pequeño fragmento, entre 100 a 500 pares que pueden variar según la prueba de PCR.
Si yo le digo a usted una frase del Principito, muy probablemente no necesitará leer todo el libro para saber que es el Principito. Igual con el PCR, con solo un fragmento sabemos que es el virus. Pero, ¿qué pasa si hay muchas mutaciones en ese fragmento? El inicio de falsos negativos. Personas con un virus muy alterado provoca que la PCR ya no lo pueda identificar.
Nosotros leemos de manera constante todo el virus y nos aseguramos de que no haya mutado de forma drástica, y así que no interfiera en la lectura del PCR. Al día de hoy, esto no ha sucedido, justamente, porque el virus ha mutado poco".
-En todo esto que me está comentando, ¿qué define si una mutación queda o no instaurada de manera permanente como lo que pasó con la mutación G que antes me indicó?
JMM: "Si la mutación presenta un beneficio para el virus, esta quedará instaurada y ese genoma se seguirá pasando entre las personas. Debemos recordar que las mutaciones son aleatorias y no todas se pueden fijar. Esto significa que si el virus genera una mutación, y luego no puede seguir viviendo en el humano, ahí termina su ciclo.
En el caso de la mutación G en la espícula S-614, muy probablemente el hecho de que le permita al virus producir más partículas y sacar más copias de ella misma, por decirlo de esa forma, se podría considerar una ventaja para el virus. Pero esto no se ha verificado del todo".
Los científicos de la UCR usan los datos crudos de secuenciación enviados por el Inciensa. Estos son fragmentos de la secuencia del virus que son reconstruidos por el grupo del Inciensa y, posteriormente, son ensamblados u ordenados en la Universidad para efectuar el análisis.
-Ahora, Dr. Molina, quiero abordar el eje de la inteligencia artificial. Uno de los objetivos escritos en el proyecto de investigación es usar este recurso. ¿Cuál es el objetivo y cómo ustedes, desde la UCR, pretenden hacerlo?
JMM: "Por el momento, la parte de inteligencia que tenemos está poco desarrollada porque necesitamos más datos. Idealmente, uno 300 datos y apenas vamos por 140 genomas.
El objetivo es usar la inteligencia artificial para predecir el comportamiento de nuevos casos y determinar si el paciente requiere un abordaje más específico para evitar que se complique y, de esta manera, intentar salvarle la vida.
Ahora bien, ¿cómo lo haremos? Mediante la vinculación entre la información genómica (sus diferentes mutaciones) con un ingrediente adicional que son los datos de los pacientes. Estos datos son sobre la mortalidad, su información clínica, así como enfermedades de fondo.
-¿Qué papel juega la bioinformática en todo esto?
JMM: "Con la bioinformática hemos logrado hacer análisis masivos del ARN del virus para hallar las mutaciones. Entonces, uniremos esa información con la historia clínica de los pacientes.
Como ya lo he dicho, si bien las mutaciones por sí mismas no generan mayor gravedad, si estas se vinculan a una enfermedad de fondo, como la diabetes, podrían generar una mayor mortalidad. Es una hipótesis que deseamos corroborar".
-¿Y cuál será el proceso?
JMM: "Nosotros vamos a tomar un conjunto de datos de la secuencia del virus y definir patrones con base en la composición del individuo en el que decimos, por ejemplo: siempre que un paciente tuvo diabetes y esta mutación del virus, la persona falleció.
Entonces, si viene un paciente nuevo con esa mutación del virus y diabetes, ya sabemos que la probabilidad de que fallezca es muy alta. Por lo tanto, se debe brindar una intervención especial según ese mal pronóstico. Esto también se está haciendo en diferentes partes del mundo. La idea es que Costa Rica tenga su propio análisis".
-Básicamente, es aprender de casos ya acontecidos.
JMM: "Así es. Uniremos las condiciones del paciente con el comportamiento del virus para entrenar a los algoritmos y calcular la probabilidad de gravedad".
-Con los siete meses que llevamos de pandemia, ¿qué puede esperar el país en relación con estas mutaciones?
JMM: "Por el momento, lo que se puede esperar es que las mutaciones por sí solas no estén asociadas a una mayor severidad de la enfermedad, mortalidad o fracaso de algún tratamiento. El factor ambiental y genético del paciente son muy relevantes y son los que parecen tener mucho mayor peso en la presentación clínica de la enfermedad.
Por ejemplo, los casos mortales están más asociados a los padecimientos de fondo que presenta un individuo (hipertensión, diabetes, asma, etc.) que por la misma genética del virus".
Coordinador de proyecto y análisis bioinformáticos:
Dr. Jose Arturo Molina Mora, Microbiólogo bioinformático, UCR-CIET.
Coordinación de secuenciación e interpretación virológica
Dra. Eugenia Corrales-Aguilar, Viróloga, UCR-CIET.
Dr. Andres Moreira-Soto, Virólogo, UCR-CIET.
Coordinación de secuenciación y vigilancia epidemiológica (Inciensa).
Dr. Francisco Duarte
Dr. Hebleen Brenes Porras
Dr. Claudio Soto-Garita
Dra. Estela Cordero
Dipl. Adriana Godínez
Ing. Melany Calderon
Asistente de proyecto: Carlos Mora Garro.
© 2024 Universidad de Costa Rica - Tel. 2511-4000. Aviso Legal. Última actualización: diciembre, 2024