Skip to main content
 
#Biotecnología #Algoritmos #Computación #Inteligencia Artificial

Un nuevo algoritmo permite identificar con mayor precisión la flexibilidad en la estructura 3D de las proteínas

El sistema, diseñado por científicos del CNB-CSIC, aborda el desafío de captar las transiciones del movimiento de las macromoléculas biológicas y sus estructuras mediante IA

Fecha de noticia:

Un equipo del Consejo Superior de Investigaciones Científicas (CSIC), dirigido por los investigadores José María Carazo y Carlos Óscar Sánchez Sorzano, ha desarrollado FlexConsensus, un nuevo algoritmo que representa un avance significativo en el análisis de la variabilidad estructural de las proteínas mediante criomicroscopía electrónica (CryoEM). El trabajo, publicado en la revista Nature Methods, aborda el desafío de captar las transiciones del movimiento de las macromoléculas biológicas y sus estructuras mediante inteligencia artificial (IA). Este avance podría tener implicaciones claves en el descubrimiento de nuevos fármacos.

Las proteínas no son estructuras rígidas: cambian de forma constantemente para cumplir funciones esenciales en los seres vivos. Aunque la criomicroscopía electrónica permite observar macromoléculas biológicas con una resolución cercana al nivel atómico, lo que se obtienen son imágenes fijas del compendio de las estructuras, sin captar el movimiento de unas formas a otras, que suele ser clave para entender procesos biológicos.

Uno de los mayores desafíos actuales es el desarrollo de potentes herramientas informáticas que permitan interpretar correctamente las diferentes formas tridimensionales que adoptan las moléculas en su entorno fisiológico. Sin embargo, los distintos métodos existentes para analizar estas variaciones producen resultados que no siempre son comparables entre sí, lo que dificulta la obtención de conclusiones fiables.

FlexConsensus, una técnica de aprendizaje profundo (deep learning), dentro de la IA, permite integrar las diferentes estimaciones de la variabilidad estructural de una molécula en un espacio “consensuado”. Este espacio facilita la comparación entre métodos existentes y mejora la interpretación de los datos, permitiendo identificar con mayor precisión las regiones más estables de las proteínas analizadas.

Análisis de datos de otras IA

“Nuestra investigación trabaja con inteligencias artificiales. Lo que hemos desarrollado es una nueva IA diseñada específicamente para analizar los resultados generados por otras inteligencias artificiales, y ofrecernos información sobre el consenso entre esos resultados”, subraya David Herreros, investigador del Centro Nacional de Biotecnología (CNB-CSIC) y primer autor del trabajo.

Actualmente “hay cuatro o cinco grupos de investigación trabajando en este campo, pero nuestro equipo ha sido el primero en intentar comprender simultáneamente lo que nos dicen las distintas inteligencias artificiales: qué tienen en común y en qué puntos divergen. Nos dimos cuenta de que, al tratarse de datos tan complejos y multidimensionales, era necesario alcanzar consensos igualmente complejos. Comprendimos que la realidad es más rica y diversa que lo que cualquiera de los métodos que estamos usando en el campo puede capturar por sí solo al intentar representar el espacio conformacional de las moléculas”, añade Carlos Óscar Sánchez Sorzano, investigador del CNB-CSIC que colidera el trabajo.

Una de las aportaciones clave de FlexConsensus es la introducción de métricas de error que permiten evaluar la reproducibilidad de los resultados y filtrar aquellas imágenes que presentan estimaciones menos fiables. Esto se traduce en un análisis más robusto, centrado en las partículas que realmente aportan información significativa sobre la dinámica molecular.

El algoritmo se ha probado en varios conjuntos de datos experimentales, incluyendo el ribosoma de Plasmodium falciparum y la proteína Spike del SARS-CoV-2. En ambos casos, FlexConsensus permitió identificar diferencias clave entre los métodos de análisis utilizados, destacando su capacidad para detectar tanto variaciones conformacionales (cambios en la forma tridimensional) como variaciones composicionales (presencia o ausencia de componentes en los complejos moleculares).

De la fotografía “fija” al movimiento, un cambio de paradigma

Este avance podría tener implicaciones importantes en biomedicina, con una incidencia clave en el descubrimiento de nuevos fármacos. Al mejorar la calidad de la comparación y de la integración entre métodos, podría abordar cuestiones fundamentales sobre la estructura y dinámica de las macromoléculas.

“Hasta ahora necesitábamos saber de partida cuántas posibles conformaciones (número de clases -K-) tenía la macromolécula objeto de estudio, lo que inevitablemente introduce un sesgo en el análisis. Con este nuevo algoritmo, se abre la puerta a un cambio revolucionario: nos olvidamos de calcular el número de clases de las macromoléculas, y llegamos al conjunto de estados estructurales y sus transiciones dentro de una misma macromolécula, su mapa bioenergético, así como la biofísica intrínseca del sistema. Esto significaría un cambio absoluto, un nuevo paradigma en criomicroscopía electrónica”, destaca el investigador José María Carazo, colíder del trabajo.

El algoritmo desarrollado en el CNB-CSIC ya se encuentra disponible a través de la plataforma Scipion 3.0, ampliamente utilizada por la comunidad científica internacional para el procesamiento de imágenes biomoleculares. La integración en esta plataforma garantiza su accesibilidad y facilita su adopción por parte de laboratorios de todo el mundo.

CNB-CSIC Comunicación

comunicacion@csic.es

Referencia científica:

David Herreros, Carlos P. Mata, Carlos Óscar S. Sorzano, José María Carazo. Merging conformational landscapes in a single consensus space with FlexConsensus algorithm. Nature Methods. DOI: 10.1038/s41592-025-02841-w

Noticias relacionadas