AlphaFold de DeepMind detecta la absorción de proteínas

Noticias

HogarHogar / Noticias / AlphaFold de DeepMind detecta la absorción de proteínas

May 26, 2023

AlphaFold de DeepMind detecta la absorción de proteínas

NUEVA YORK – Desde su presentación en 2018, el programa AlphaFold de DeepMind ha

NUEVA YORK – Desde su introducción en 2018, el programa AlphaFold de DeepMind se ha convertido en una herramienta clave en la investigación biológica, lo que permite a los científicos predecir estructuras de proteínas con alta precisión en función de sus secuencias de aminoácidos.

Más recientemente, los investigadores han comenzado a usar AlphaFold y su iteración más reciente, AlphaFold2, para el trabajo de interacción proteína-proteína (PPI), explorando su utilidad para predecir y validar las interacciones de proteínas, así como para generar modelos de sus estructuras.

Estos esfuerzos siguen estando limitados por los recursos informáticos intensivos necesarios, pero los estudios indican que los enfoques basados ​​en IA podrían resultar útiles para estudios de PPI a gran escala y podrían complementar las herramientas existentes como la espectrometría de masas y los sistemas de dos híbridos de levadura.

"Es un espacio muy interesante", dijo Juri Rappsilber, profesor de proteómica en la Universidad de Edimburgo y profesor de bioanálisis en el Instituto de Tecnología de Berlín. En abril, él y sus colegas publicaron un estudio en Molecular Systems Biology sobre la combinación de espectrometría de masas de reticulación y espectrometría de masas de cofraccionamiento con el software AlphaFold-Multimer, una extensión de AlphaFold2 destinada a la investigación de PPI, para predecir y validar PPI en Bacillus subtilis. .

Rappsilber citó como un uso común lo que llamó un "despliegue alfa" en el que los investigadores usan el software para detectar interactores de proteínas candidatas contra una proteína particular de interés, como lo harían con un experimento de espectrometría de masas de desmontaje inmunológico.

"Tienen una proteína que les interesa, y tienen una cantidad de proteínas candidatas que creen que pueden interactuar con esa proteína, y simplemente las lanzan una por una contra su proteína de interés", dijo Rappsilber.

"Si AlphaFold es positivo, entonces es muy probable que los dos estén interactuando", dijo. "Entonces pasas de tener 10 o 20 o 50 candidatos a un puñado de candidatos, y eso es más plausible de seguir".

Rappsilber agregó que, lo que es más importante, a diferencia de otros enfoques para validar los PPI, los investigadores salen de un experimento de este tipo con modelos de las estructuras de las interacciones.

"Y esa es una instrucción muy clara de qué hacer a continuación como experimento", dijo, y señaló que con esta información estructural, los investigadores pueden diseñar mutantes puntuales en los sitios de interacción, lo que les permite interrumpir la interacción e investigar su efecto biológico.

"La principal limitación es el poder computacional", dijo Panagiotis Kastritis, profesor junior de crio-EM en la Universidad Martin-Luther de Halle-Wittenberg y presidente de ERA para crio-EM en la Fundación Nacional de Investigación Helénica de Grecia, sobre el uso de AlphaFold para el trabajo PPI. "La mayoría de estos cálculos se han realizado en computadoras a escala de instituto".

Sin embargo, Kastritis señaló que es probable que esto se convierta en un desafío menor en los próximos cinco a 10 años a medida que el poder de cómputo continúa siendo menos costoso y más accesible.

También sugirió que ciertas estrategias informáticas podrían reducir la potencia computacional requerida para usar AlphaFold para el trabajo de PPI a gran escala. Por ejemplo, dijo, AlphaFold2 predice estructuras de proteínas utilizando lo que se denomina alineamientos de secuencias múltiples, que produce tomando la secuencia de aminoácidos de una proteína y comparándola con otras bases de datos de secuencias de proteínas para identificar secuencias similares que utiliza para construir sus modelos. Kastritis dijo que a medida que se identifican más y más de estos MSA, se pueden almacenar de tal manera que permite que el software acceda a ellos directamente en lugar de tener que buscar una vez más en las bases de datos de secuencias para identificarlos.

"Si tenemos [MSA] predeterminados y precalculados, por supuesto que sería más rápido y más fácil", dijo.

En abril, investigadores de Microsoft y la Universidad Libre de Berlín publicaron una preimpresión de BioRxiv que utilizó varios enfoques computacionales, incluidos algunos similares a los sugeridos por Kastritis, para acelerar la predicción de PPI de AlphaFold2. Según los autores, cuando aplicaron su enfoque para predecir las interacciones por pares de 1.000 proteínas, redujeron el tiempo requerido para las predicciones en 40 veces y redujeron el espacio en disco requerido en 4.460 veces.

Uno de los autores de la preimpresión, Patrick Bryant, becario postdoctoral en la Free University, también fue el primer autor de un artículo de Nature Communications de 2022 que detallaba una nueva tubería para la predicción de PPI basada en AlphaFold2 llamada FoldDock. En enero de 2023, Bryant y un equipo dirigido por investigadores de SciLifeLab en la Universidad de Estocolmo (donde Bryant había sido estudiante de posgrado) y el Instituto Europeo de Bioinformática usaron la tubería FoldDock para predecir estructuras para 65 484 PPI humanos, generando 3137 modelos PPI de alta confianza. .

Kastritis dijo que los investigadores también están utilizando datos experimentales producidos por técnicas como espectrometría de masas y microscopía crioelectrónica para hacer que las predicciones de AlphaFold2 sean menos intensivas desde el punto de vista computacional. Por ejemplo, dijo, un investigador podría proporcionar a AlphaFold2 datos de espectrometría de masas de enlaces cruzados o la forma y la estructura 3D de las proteínas según lo determinado por crio-EM y pedirle que prediga solo las estructuras de proteínas que concuerdan con los datos experimentales.

"Usando este tipo de información, podemos reducir los costos computacionales", dijo.

"Tienes que ir impulsado por los candidatos", dijo Rappsilber, y también destacó la utilidad de los datos experimentales en combinación con AlphaFold.

En su estudio de MSB, Rappsilber y sus coautores comenzaron usando espectrometría de masas de entrecruzamiento en células enteras de B. subtilis para identificar posibles interacciones proteína-proteína. Identificaron un total de 560 PPI, 384 de los cuales no habían sido detectados previamente. Siguieron esto con experimentos de espectrometría de masas de cofraccionamiento, que identificaron 667 PPI candidatos, lo que resultó en un total de 878 PPI candidatos generados por los dos métodos.

Luego, los investigadores descargaron PPI conocidos de alta calidad de la base de datos SubtiWiki de B. subtilis y los combinaron con sus PPI derivados experimentalmente para crear un conjunto de 2032 PPI candidatos que enviaron a AlphaFold-Multimer. El software pudo generar modelos estructurales de alta calidad para 114 de estas interacciones.

AlphaFold-Multimer también pudo predecir estructuras de alta calidad para 14 complejos de proteínas triméricas, lo que indica su potencial para ir más allá de los IBP binarios.

La predicción de complejos de proteínas que consisten en múltiples proteínas u otras moléculas sigue siendo un desafío difícil, señaló Kastritis, que no participó en el estudio de MSB. Un problema importante con complejos tan grandes, dijo, ha sido que las inexactitudes menores en las predicciones de la estructura de la proteína pueden propagarse a lo largo del complejo más amplio, lo que lleva a inexactitudes más grandes.

Mirando hacia el futuro, Rappsilber dijo que ve tres rutas principales, todas las cuales se están siguiendo actualmente, por las cuales AlphaFold y otras herramientas basadas en IA se volverán más útiles para el trabajo complejo de proteínas e IBP a gran escala.

El primero, que describió como el enfoque de "fuerza bruta", es simplemente aprovechar las mejoras continuas en el poder de cómputo.

"Espera un poco y tu reloj inteligente podrá hacerlo", bromeó.

El segundo camino es el desarrollo continuo de estrategias computacionales más rápidas y eficientes para realizar dicho trabajo, como la canalización FoldDock mencionada anteriormente.

El tercero es una integración más efectiva de datos experimentales para ayudar a las predicciones basadas en IA. Aquí es donde se centran gran parte de los esfuerzos de su laboratorio, dijo Rappsilber, señalando un artículo reciente de su laboratorio que detalla una versión de AlphaFold2 llamada AlphaLink que incorpora datos de fuentes como datos de experimentos de espectrometría de masas cruzados que pueden proporcionar al software información sobre la distancia entre ciertos residuos de aminoácidos.

Con datos de enlaces cruzados, "podríamos obtener estructuras para objetivos desafiantes donde AlphaFold solo falló", dijo.