Profesores del Máster en Bioinformática desarrollan la primera herramienta de secuenciación de nanoporos a gran escala
Joaquín Dopazo, miembro de
la Comisión de Coordinación Académica y profesor del máster en
Bioinformática ha desarrollado en su laboratorio de genómica del Centro
de Investigación Príncipe Felipe (CIPF) la primera herramienta de
secuenciación de nanoporos a gran escala. Este proyecto también ha
contado con la colaboración de Vicente Arnau, director del máster, y
Asunción Gallego, recién graduada en Ingeniería Informática y
galardonada con el premio al mejor Trabajo de Fin de Grado de su
promoción. La solución bioinformática desarrollada supone una nueva
herramienta para el análisis de datos de secuenciación de ADN obtenidos
con tecnología Nanopore.
18 de abril de 2016
El laboratorio de Genómica de Sistemas del Centro del CIPF, dirigido por Dopazo, ha publicado en la revista BMC Bioionformatics el artículo “HPG pore: an efficent and scalable framework for nanopore sequencing data” sobre su nueva herramienta. HPG Pore
surge frente al aumento ilimitado de datos generados por la tecnología
de secuenciación en tiempo real que se prevé de cara al futuro. Esta
herramienta pretende resolver el problema de saturación de información,
permitiendo una gestión y análisis eficiente de grandes volúmenes de
datos genómicos. En definitiva, el objetivo es explorar y analizar más
fácilmente el creciente volumen de información de secuenciación que
generan las tecnologías de nanoporos.
Las recientes tecnologías de
secuenciación presentan importantes innovaciones que permiten avanzar en
el procesamiento de datos relacionados con el ADN. Entre ellas
encontramos la novedosa tecnología de los nanoporos, que permite obtener la secuencia de ADN con un coste muy bajo, por lo que en el futuro las pruebas de ADN podrían ser cada vez más frecuentes en la detección y tratamiento de enfermedades. La tecnología de secuenciación Nanopore
ha demostrado ser eficaz clínicamente en la vigilancia de patógenos en
tiempo real, puesto que permite identificar rápidamente las cepas y
detectar genes de resistencia, o incluso la variación estructural en el
cáncer.
Al pasar la secuencia del ácido
desoxirribonucleico a través de estos pequeños poros, sus nucleótidos
componentes provocan distorsiones características, que se traducen en
unos cambios eléctricos medibles. De modo que podemos “leer”
virtualmente la secuencia de nucleótidos en tiempo real.
Con esta nueva tecnología se fuerza al
ADN a pasar por una estructura artificial que recuerda a los poros que
hay en la superficie de las bacterias. El dispositivo que se encarga de
realizar la lectura es del tamaño de un teléfono móvil y se puede
conectar a través de un puerto USB al ordenador. Según los expertos, el
uso indiscriminado de esta tecnología podría colapsar en el futuro los
sistemas actuales de procesamiento de datos, de modo que este trabajo se
presenta como la primera solución para el control de esta información
de manera escalable, a fin de procesar el creciente volumen de
secuencias que se genera.
"Es probable que la secuenciación de nanoporos se extienda en un futuro debido a su portabilidad y a su capacidad de secuenciar largos fragmentos de moléculas de ADN sin amplificación previa".
El proyecto HPG Pore es la primera herramienta bioinformática escalable que
estudia los datos de secuenciación de nanoporos y que puede ser
ejecutada en equipos individuales, así como en sistemas modernos de
almacenamiento distribuido, que funcionan con una tecnología abierta
llamada Hadoop, la cual permite el escalado ilimitado de datos virtualmente.
Según Dopazo, es probable que la
secuenciación de nanoporos se extienda en un futuro debido a su
portabilidad y a su capacidad de secuenciar largos fragmentos de
moléculas de ADN sin amplificación previa. Actualmente, las herramientas
existentes para el análisis de esta información solo están capacitadas
para administrar proyectos pequeños y no son escalables.
Por ello, HPG Pore supone un
gran avance, ya que permite una gestión eficaz de estos datos masivos
constituyendo una solución a las necesidades de análisis en un futuro
próximo, así como un modelo para la creación de nuevas herramientas con
las que tratar grandes volúmenes de datos genómicos.
No hay comentarios.: