‘MOEBA-BIO’, una herramienta para descubrir estructuras ocultas en datos biomédicos


Este software de código abierto mejora el análisis genético, con impacto en la medicina personalizada
Categoría: Investigación
Un equipo científico de la Universidad de Málaga ha dado un importante paso en el análisis de datos biomédicos gracias al desarrollo de ‘MOEBA-BIO’, un software de código abierto que ofrece una base flexible y adaptable, creado para detectar patrones ocultos en grandes matrices de datos. Desarrollada en colaboración con la Universidad de Lille (Francia), esta herramienta representa un avance significativo en el campo del análisis genético y podría tener un impacto directo en áreas como la medicina personalizada.
El trabajo, recientemente publicado en la revista Computer Methods and Programs in Biomedicine, ha sido liderado por Adrián Segura Ortiz (investigador del grupo Khaos y doctorando en Tecnologías informáticas de la UMA), bajo la dirección de José Manuel García Nieto (Dpto. Lenguas y Ciencias de la Computación). Asimismo, la investigación se ha realizado en colaboración con el grupo ORKAD de la Universidad de Lille (Francia), liderado por la profesora Laetitia Jourdan y con la participación de Adán José García, reconocido experto en biclustering.
MOEBA-BIO y la técnica biclustering
“MOEBA-BIO es un framework evolutivo de biclustering que ofrece una base flexible y adaptable. El biclustering permite identificar subgrupos coherentes tanto de genes como de condiciones experimentales”, explica Adrián Segura Ortiz. Esta técnica es especialmente útil para estudiar la ‘coexpresión génica’, es decir, la forma en la que ciertos genes se activan de forma similar bajo determinadas condiciones, algo que ya se está extrapolando con éxito en datos clínicos para encontrar perfiles de pacientes similares, y que puede tener un especial impacto en el ámbito de la medicina personalizada.
El diseño de esta nueva herramienta parte de una idea clara: proporcionar una solución versátil, capaz de adaptarse a distintos tipos de datos biomédicos. Para ello, “incorpora una novedosa codificación que dota al algoritmo de una visión global del problema, permitiéndole no solo optimizar cada grupo de genes, sino también decidir cuántos grupos son necesarios y cómo deben relacionarse entre sí”, detalla Segura Ortiz. Además, cuenta con un ‘autoconfigurador’ que ajusta automáticamente los parámetros del algoritmo según las características del problema, lo que reduce la necesidad de intervención experta.
Una aplicación versátil
La publicación, que refleja su especialización para el análisis de ‘coexpresión génica’, revela resultados muy prometedores tanto en datos simulados, en los que logra detectar correctamente los patrones ocultos generados artificialmente; como en datos reales, cuyos resultados han sido validados mediante análisis de enriquecimiento funcional, mostrando un alto grado de coherencia biológica.
"Una de las cosas que más valoramos es que esta herramienta no se queda en un único tipo de aplicación", matiza Segura Ortiz. Por ello, MOEBA-BIO supone una base versátil que se puede adaptar fácilmente a otros problemas biomédicos, “desde la genética hasta la clínica. Nuestra intención es que sirva de puente entre los métodos computacionales más avanzados y los expertos biomédicos que necesitan herramientas intuitivas pero potentes para analizar sus datos”, añade el investigador.
La proyección de MOEBA-BIO
La estrategia aplicada en la implementación de MOEBA-BIO permite una fácil ampliación mediante la incorporación de nuevas representaciones, operadores más sofisticados, manejo de datos heterogéneos y muchas otras opciones, lo que ofrece un amplio abanico de posibilidades para definir futuras líneas de trabajo.
Este avance forma parte de su tesis doctoral, y el software ya está disponible en abierto para su uso por parte de la comunidad científica en el siguiente repositorio. Actualmente, el equipo busca colaboradores de otras disciplinas biomédicas que quieran aplicar la herramienta a sus propios datos para seguir explorando su potencial.
Referencia bibliográfica:
Segura-Ortiz, A., José-García, A., Jourdan, L., & García-Nieto, J. (2025). Exhaustive biclustering driven by self-learning evolutionary approach for biomedical data. Computer Methods and Programs in Biomedicine, 108846. https://doi.org/10.1016/j.cmpb.2025.108846