Profesores del Máster en Bioinformática desarrollan la primera herramienta de secuenciación de nanoporos a gran escala

Joaquín Dopazo, miembro de la Comisión de Coordinación Académica y profesor del máster en Bioinformática ha desarrollado en su laboratorio de genómica del Centro de Investigación Príncipe Felipe (CIPF) la primera herramienta de secuenciación de nanoporos a gran escala. Este proyecto también ha contado con la colaboración de Vicente Arnau, director del máster, y Asunción Gallego, recién graduada en Ingeniería Informática y galardonada con el premio al mejor Trabajo de Fin de Grado de su promoción. La solución bioinformática desarrollada supone una nueva herramienta para el análisis de datos de secuenciación de ADN obtenidos con tecnología Nanopore.

18 de abril de 2016

El laboratorio de Genómica de Sistemas del Centro del CIPF, dirigido por Dopazo, ha publicado en la revista BMC Bioionformatics el artículo “HPG pore: an efficent and scalable framework for nanopore sequencing data” sobre su nueva herramienta. HPG Pore surge frente al aumento ilimitado de datos generados por la tecnología de secuenciación en tiempo real que se prevé de cara al futuro. Esta herramienta pretende resolver el problema de saturación de información, permitiendo una gestión y análisis eficiente de grandes volúmenes de datos genómicos. En definitiva, el objetivo es explorar y analizar más fácilmente el creciente volumen de información de secuenciación que generan las tecnologías de nanoporos.

Las recientes tecnologías de secuenciación presentan importantes innovaciones que permiten avanzar en el procesamiento de datos relacionados con el ADN. Entre ellas encontramos la novedosa tecnología de los nanoporos, que permite obtener la secuencia de ADN con un coste muy bajo, por lo que en el futuro las pruebas de ADN podrían ser cada vez más frecuentes en la detección y tratamiento de enfermedades. La tecnología de secuenciación Nanopore ha demostrado ser eficaz clínicamente en la vigilancia de patógenos en tiempo real, puesto que permite identificar rápidamente las cepas y detectar genes de resistencia, o incluso la variación estructural en el cáncer.

Al pasar la secuencia del ácido desoxirribonucleico a través de estos pequeños poros, sus nucleótidos componentes provocan distorsiones características, que se traducen en unos cambios eléctricos medibles. De modo que podemos “leer” virtualmente la secuencia de nucleótidos en tiempo real.

Con esta nueva tecnología se fuerza al ADN a pasar por una estructura artificial que recuerda a los poros que hay en la superficie de las bacterias. El dispositivo que se encarga de realizar la lectura es del tamaño de un teléfono móvil y se puede conectar a través de un puerto USB al ordenador. Según los expertos, el uso indiscriminado de esta tecnología podría colapsar en el futuro los sistemas actuales de procesamiento de datos, de modo que este trabajo se presenta como la primera solución para el control de esta información de manera escalable, a fin de procesar el creciente volumen de secuencias que se genera.

"Es probable que la secuenciación de nanoporos se extienda en un futuro debido a su portabilidad y a su capacidad de secuenciar largos fragmentos de moléculas de ADN sin amplificación previa".

El proyecto HPG Pore es la primera herramienta bioinformática escalable que estudia los datos de secuenciación de nanoporos y que puede ser ejecutada en equipos individuales, así como en sistemas modernos de almacenamiento distribuido, que funcionan con una tecnología abierta llamada Hadoop, la cual permite el escalado ilimitado de datos virtualmente.

Según Dopazo, es probable que la secuenciación de nanoporos se extienda en un futuro debido a su portabilidad y a su capacidad de secuenciar largos fragmentos de moléculas de ADN sin amplificación previa. Actualmente, las herramientas existentes para el análisis de esta información solo están capacitadas para administrar proyectos pequeños y no son escalables.

Por ello, HPG Pore supone un gran avance, ya que permite una gestión eficaz de estos datos masivos constituyendo una solución a las necesidades de análisis en un futuro próximo, así como un modelo para la creación de nuevas herramientas con las que tratar grandes volúmenes de datos genómicos.