eMIRNA: una nueva herramienta informática para detectar genes microRNA
Los microRNAs son pequeñas moléculas de RNA cuya función principal consiste en regular la expresión de los genes y adecuarla a las necesidades fisiológicas del organismo. En este sentido, los microRNAs tienen la capacidad de unirse a RNAs mensajeros y propiciar su degradación o reprimir su traducción a proteínas en los ribosomas. Asimismo, pueden influir decisivamente en la activación o represión de numerosas rutas metabólicas y regular procesos biológicos relevantes y muy variados. Es por tanto sumamente importante localizar e identificar los genes microRNAs presentes en el genoma de una especie con el objetivo de caracterizar su secuencia y su función biológica, así como detectar posibles mutaciones que pudieran afectar a su actividad reguladora.
Uno de los principales obstáculos que los investigadores encuentran a la hora de estudiar los genes microRNA es precisamente la falta de catálogos fiables en numerosas especies de gran interés productivo como son el cerdo, la oveja o la cabra. Ello demuestra la imperiosa necesidad de disponer de herramientas informáticas que permitan identificar y caracterizar este tipo de genes microRNA, a partir de cualquier genoma animal, con la finalidad de construir catálogos lo más completos posibles.
En este estudio, publicado en la revista Genomics, hemos desarrollado una herramienta bioinformática que permite la predicción y anotación funcional de microRNAs. Esta herramienta comprende distintos módulos descargables de fácil uso y adaptabilidad. Una descripción detallada de esta metodología puede encontrarse en: https://github.com/emarmolsanchez/eMIRNA. Nuestra motivación partió de la necesidad de profundizar en la anotación de microRNAs en el genoma porcino, una de las especies domésticas con mayor impacto económico en el sector ganadero en Cataluña.
Una de las principales innovaciones de la herramienta eMIRNA consistió en demostrar la eficacia de incluir la búsqueda de motivos nucleotídicos en la reconstrucción de genes microRNA a partir de datos de secuenciación masiva y comparación por homología. Mediante una aproximación basada en grafos y un algoritmo transductivo de Machine Learning, pudimos incrementar la cantidad de información disponible en el entrenamiento de nuestro modelo clasificador, mejorando así su capacidad predictiva respecto a la de otros algoritmos previamente publicados.
Además, demostramos la aplicabilidad práctica de esta nueva herramienta utilizando datos de secuenciación masiva de microRNAs en músculo de cerdos Duroc. Un total de 47 microRNAs no incluidos en el catálogo porcino, y por tanto de cuya existencia nada se sabía, fueron detectados mediante el modelo implementado en eMIRNA, de los cuales, un total de 20 se identificaron en las muestras de músculo porcino.
La herramienta eMIRNA, en definitiva, permite predecir con una elevada fiabilidad los genes microRNA de cualquier especie animal, así como caracterizar funcionalmente sus posibles dianas metabólicas, proporcionando la oportunidad de mejorar los catálogos de genes microRNA en numerosas especies con anotaciones genómicas aún muy limitadas. Dicha tarea resulta indispensable para entender en profundidad, por ejemplo, la función de los microRNAs en la regulación de numerosos caracteres productivos de interés para el sector ganadero porcino.
Emilio Mármol Sánchez1 y Marcel Amills1,2
1Centro de Investigación Agrigenòmica.
2Universitat Autònoma de Barcelona.
Referencias
Mármol-Sánchez E, Cirera S, Quintanilla R, Pla A, Amills M. (2020). Discovery and annotation of novel microRNAs in the porcine genome by using a semi-supervised transductive learning approach. Genomics 112: 2107-2118 doi: https://www.sciencedirect.com/science/article/pii/S0888754319304884?via%3Dihub