Back

Bioinformatics

Science Bits: Entrevista a Manuel Muñoz

“Machine learning para vincular datos con fenotipos humanos”

  • 24/03/2021
  • 4 mins reading time
Machine Learning Science Bits
Foto: Manuel Muñoz

Manuel Muñoz es ingeniero en cibernética electrónica y actualmente está realizando su tesis doctoral desarrollando un modelo de deep learning para vincular variación en imágenes histológicas con variación en expresión génica en el laboratorio de Biología Computacional para el procesamiento de ARN del CRG.

En el laboratorio del Dr. Guigó, investigan las señales implicadas en la especificación de genes en secuencias genómicas estudiando el mecanismo de su reconocimiento, el procesamiento y la evolución. También participan en el desarrollo de software para la predicción y anotación de genes en secuencias genómicas.

Cuéntanos qué estudiaste y por qué lo escogiste.

Estudié Ingeniería en Cibernética Electrónica y un máster Erasmus Mundus en Minería de Datos y Gestión del Conocimiento. Elegí ese grado porque tenía un buen balance entre electrónica y computación, además de tener una concentración en bioingeniería. Después del grado, me empezó a interesar mucho la combinación de computación con análisis de datos a gran escala, principalmente por su versatilidad y por el impacto que tiene en muchos campos: desde las redes sociales, hasta aplicaciones en la ciencia. Por estas razones decidí estudiar un máster que estuviese enfocado en estadística y métodos computacionales para el análisis de datos. Actualmente estoy terminando el doctorado en Estadística e Investigación Operativa en la Universidad Politécnica de Cataluña con los proyectos de tesis desarrollados en el laboratorio de Biología Computacional para el Procesamiento del ARN, en el Centro de Regulación Genómica.

¿Pensabas dedicarte a la investigación cuando terminaste el grado? ¿Qué te motivó a investigar?

Siempre me llamó la atención la investigación, aunque al inicio no tenía exactamente claro la rama específica a la que quería dedicarme, y tampoco lo veía como mi única salida laboral. Por ejemplo, mi trabajo de fin de grado fue sobre el desarrollo de controladores que permitieran gestionar dispositivos de hardware dentro de una plataforma computacional emulada: era un trabajo completamente orientado a temas de electrónica y sistemas operativos. Más adelante, cuando empecé a especializarme en el análisis de datos, me di cuenta de la gran cantidad que se manejan en la rama de la bioinformática. Me pareció que sería una buena manera de unir muchos de los temas que había estudiado hasta ese momento y, por esa razón, hice el trabajo de fin de máster en el laboratorio donde estoy actualmente.

Durante el TFM, trabajé en predicción de fenotipos humanos con base en expresión génica, utilizando modelos de machine learning. Esta línea de investigación me gustó mucho y encontré que la bioinformática es, en general, muy estimulante, principalmente por la rápida velocidad con la que se mueve el campo, tanto desde el punto de vista de la generación y análisis de datos, así como del desarrollo de nuevos métodos estadísticos/computacionales para procesarlos. Más que una «motivación», creo que algo que, al menos a mí, me mantiene interesado es la curiosidad por encontrar una explicación para una observación o hipótesis concreta y ser consciente de que en muchas ocasiones puede haber maneras distintas para interrogar la información que tienes disponible. Por estas razones, decidí empezar un doctorado para profundizar en el tema.

¿Qué líneas de investigación sigue tu laboratorio? ¿Nos podrías explicar en qué consiste tu investigación?

Nuestro laboratorio, Biología Computacional para el Procesamiento del ARN, dirigido por el Dr. Roderic Guigó, se enfoca en entender la información codificada en secuencias genómicas y cómo esta información se procesa desde el ADN hasta las proteínas. Ejemplos concretos de temas son la expresión génica y su regulación, la anotación del genoma e identificación de regiones funcionales, el splicing, la cromatina, el desarrollo de herramientas de software bioinformático, entre otros. El laboratorio ha participado en proyectos internacionales a gran escala, como por ejemplo, GTEx y ENCODE. Hay miembros del laboratorio que se dedican a la parte experimental y otros están enfocados a la parte computacional, como es mi caso.

Mi investigación está centrada en la aplicación de métodos de aprendizaje estadístico/machine learning para vincular diferentes tipos de datos con fenotipos humanos: desde expresión génica hasta imágenes histológicas. Durante la tesis, he contribuido con varios proyectos, por ejemplo: i) la estimación del intervalo post-mortem en humanos utilizando expresión génica, ii) la inferencia computacional de enriquecimientos celulares a partir de bulk RNA-seq y cómo las desviaciones en estos niveles pueden estar relacionadas con fenotipos histológicos asociados a enfermedades, iii) la caracterización del panorama de la expresión diferencial entre hombres y mujeres, y iv) el desarrollo de una herramienta de software para el preprocesamiento de imágenes histológicas de alta resolución. El tema final con el que estoy cerrando la tesis es el desarrollo de un modelo de deep learning para vincular variación en imágenes histológicas con variación en expresión génica, con la intención de replicar computacionalmente la tecnología experimental de transcriptómica espacial.

¿Qué tienes pensado hacer cuando acabes el doctorado?

Tengo claro que me gustaría seguir dedicándome a la investigación, con enfoque a desarrollo y/o aplicación de métodos de machine learning. Aún tengo que evaluar si me gustaría hacer esto en un entorno académico o industrial.

¿Con qué actividades complementas tu vida profesional?

Me gusta mucho participar en «hackatones» de temas que sean ajenos a la bioinformática: durante el doctorado he participado en varios junto con otros compañeros del laboratorio. Un ejemplo es el «Citython» de Barcelona, que en ediciones pasadas ha estado enfocado en solucionar problemas relacionados a la movilidad urbana y gentrificación. Son experiencias divertidas para conocer personas de otras áreas con visiones y opiniones distintas, y formar equipos para generar soluciones en un tiempo limitado. Por lo que resta, mis actividades son las de un estudiante de doctorado cualquiera. Soy originario de México, así que cuando puedo, aprovecho para viajar un poco por Europa y conocer nuevos lugares. Desafortunadamente, y como es de esperar, con la situación de la COVID-19, estos aspectos se han frenado. Como ahora hay que pasar mucho tiempo en casa, estoy aprendiendo a tocar el piano.

¿Qué le dirías a alguien que esté terminando el grado de Bioinformática?

Para aquellos que quieran dedicarse a la investigación, algo que vale la pena es formarse un panorama concreto de las diferentes áreas que existen en la bioinformática (leyendo artículos recientes, por ejemplo) e identificar cuáles se alinean más con sus intereses y habilidades: algunas áreas tienen componentes más fuertes de biología, mientras que otras son más computacionales. Si les interesa más lo último, algo que puede dar buena visibilidad a su formación en bioinformática es tener un perfil de GitHub, donde se muestren algunos de los proyectos que se han realizado. Por último, hacer un internship en algún laboratorio de bioinformática es una buena manera de identificar qué cosas forman parte del día a día de la labor de investigación y decidir si es algo que se quiera realizar a largo plazo.

 


Alexis Molina, alumni del BDBI
Laura Serra, alumna del BDBI

We also recommend you