Menu

Patogénesis y evolución de la malaria en Colombia: una mirada desde el análisis topológico

Los eventos epidémicos aumentan la conectividad entre sub-poblaciones que, de otra manera, están aisladas y son clonales. Esto promueve la combinación de mutaciones distintas que pueden tener un beneficio para el parásito como la resistencia a los antimaláricos.

Una de las técnicas más novedosas en el análisis de datos, que con el auge del big data ha tomado vuelo propio, es el análisis topológico de datos (mejor conocido como TDA, por su sigla en inglés).

Es una técnica que consiste en investigar las propiedades estructurales de los datos para encontrar clusters en datos multidimensionales, y además sus conexiones. En mi opinión, uno de los mejores ejemplos para ilustrar la técnica es el caso de muchos puntos que en conjunto forman una mano, pero cuya "forma" es desconocida para los investigadores. El algoritmo usa una función filtro y una medida de distancia, para luego hacer inferencia sobre la estructura subyacente en los datos.



Algoritmo usa una función filtro y una medida de distancia 

Si bien el ejemplo es simple por su propósito didáctico, ilustra una técnica que ha tenido resultados asombrosos en temas tan diversos como la medicina, las ciencias del deporte, y las redes de internet, por solo mencionar algunos.

En medicina, por ejemplo, se han logrado identificar subgrupos de personas que presentan una clínica particular y que requiere tratamiento específico en diabetes con base en datos de paciente y pruebas diagnósticas.

También, se han identificado factores genéticos que determinan la eficacia de un medicamento para diferentes enfermedades, la configuración óptima de equipos de deportes variados, y se han identificado las diferencias partidistas en redes de contactos en Twitter, por solo mencionar algunas de las múltiples aplicaciones que tiene la técnica. 

En un artículo reciente, en conjunto con Felipe González, Andrés Ángel y Camilo Rivera, identificamos las diferentes regiones maláricas en Colombia con un análisis de TDA. El algoritmo, donde analizamos la relación entre las series de tiempo de todas las parejas posibles de municipios del país, identificó de manera pertinente los lugares con diferentes perfiles epidemiológicos (tanto por etnicidad, como en la tendencia de la incidencia de malaria). 















Adicionalmente, por petición de uno de un revisor del artículo, analizamos los cambios de cobertura y de uso de suelo en el país, y encontramos que hay una estrecha relación con las dinámicas de la malaria. En pocas palabras, la malaria se incrementó donde hay más minería y deforestación moderada, y se redujo en lugares con cambio antrópico moderado y medio. Esto quiere decir que la política de extracción minera debe estar asociada a programas de salud pública, y que programas del gobierno asociados a cambios de usos de suelo tienen un potencial enorme para reducir la carga de la enfermedad.














Dado que los resultados fueron tan positivos, de momento estamos utilizando los mismos métodos para analizar las dinámicas de transmisión a una escala micro-territorial. Para ello, trabajamos con Vladimir Corredor, profesor de genética en la escuela de salud pública de la Universidad Nacional, quien cuenta con un proyecto asombroso y que merece toda la admiración, tanto por el compromiso científico como por el compromiso con el desarrollo comunitario (el proyecto fue financiado por el Newton Fund Institutional links/British Council), y con un equipo que incluye a Pablo Cárdenas y Manuela Carrasquilla, y a varios colaboradores en el instituto Sanger (algo así como la Nasa de la malaria) y a colaboradores de Harvard y MIT.

El objetivo de la investigación a nivel microterritorial es analizar la relación existente entre las dinámicas epidemiológicas y la variabilidad genética del parásito. Esto es relevante porque Colombia, a pesar de no ser un país donde la malaria causa muchas muertes (comparado con África), es el lugar donde el parásito ha desarrollado resistencia a los antimaláricos.

La malaria es la enfermedad que más muertes ha causado en la historia de la humanidad, y ha sido gracias a tratamiento oportuno que se ha podido reducir la carga que representa a nivel mundial. Si se desarrolla resistencia a los tratamientos derivados de la artemisina, como ya se ha visto en el sudéste asiático, estaríamos ante una de las mayores emergencias humanitarias que se hayan conocido en salud pública.

Gracias a este grupo tan selecto, logramos ensamblar una gran cantidad de datos genómicos del parásito para el área de estudio de Guapi, donde tuvo lugar la recolección de datos. El ensamblaje de datos genómicos a gran escala es uno de los retos computacionales más grandes que tiene la bioinformática contemporánea, por lo cual fue necesario implementar "tubos" de datos para construir la base de datos con la cual se pudiera hacer un análisis de TDA.

Con base en la información genómica, analizamos los diferentes clusters de malaria (en lugar de analizar la serie de tiempo para cada punto geográfico, usamos la secuencia genética de cada caso).

Para ser más precisos, usamos las distancias genéticas y proyectamos sobre ventanas dinámicas en el tiempo, para encontrar las diferentes sub-poblaciones del parásito en el tiempo y el espacio, y lo que es más importante, las relaciones entre dichas sub-poblaciones.



Resultados

Cada nodo en el grafo representa un cluster de casos que el algoritmo identifica como una sub-población. Las conexiones entre nodos representan un caso que está presente en dos clusters (el algoritmo de TDA necesita que los clusters estén sobrelapados, de manera que las intersecciones entre dichos clusters serán casos asignados a ambos nodos). El tamaño de los nodos representa el número de casos, y el color, la mezcla de cada sub-población (dado que se identifican 3 poblaciones genéticamente diferenciadas, usamos RGB para representarlas).

Como podemos observar en la siguiente gráfica animada, existe un aislamiento geográfico de las sub-poblaciones de malaria en la región de Guapi. Durante los eventos epidémicos, estas poblaciones, relativamente aisladas, se tornan en poblaciones simpátricas, es decir, existe cierto nivel de aislamiento entre ellas a pesar de que se mezclan en el espacio. Sin embargo, en los eventos epidémicos, el algoritmo de TDA identifica una sola población compuesta por todos los casos combinados (a diferencia de las poblaciones aisladas y clonales cuando no hay eventos epidémicos).



Como conclusión, los eventos epidémicos aumentan la conectividad entre sub-poblaciones que, de otra manera, están aisladas y son clonales. Esto promueve la combinación de mutaciones distintas que pueden tener un beneficio para el parásito como la resistencia a los antimaláricos.

Con estos datos, hemos explorado la relación entre la epidemiología y la genética de la malaria, para identificar las trayectorias evolutivas del parásito. Sin duda, hay mucho camino por recorrer, pero este es un paso importante para entender lo que a mi juicio es la problemática más importante (en el gran esquema) de la malaria en Colombia: la manera como emergen parásitos resistentes en el país.

No hay comentarios.:

Con tecnología de Blogger.