AlphaFold es una IA que predice la estructura de las proteínas
Las proteínas son las moléculas más importantes de la vida, ya que realizan funciones esenciales para el funcionamiento de las células, los tejidos y los organismos. Sin embargo, conocer la estructura y el comportamiento de las proteínas es un reto científico enorme, que requiere de técnicas experimentales complejas y costosas. Por eso, la inteligencia artificial (IA) se ha convertido en una aliada poderosa para los biólogos, que pueden utilizarla para predecir y diseñar proteínas con una precisión y una rapidez sin precedentes.
Uno de los hitos más recientes en este campo fue el logro de AlphaFold, un sistema de IA desarrollado por DeepMind, la empresa de Google especializada en aprendizaje profundo. AlphaFold resolvió el llamado “problema del plegamiento de proteínas”, que consiste en determinar la forma tridimensional que adopta una proteína a partir de su secuencia de aminoácidos, los bloques que la componen. La forma de una proteína es clave para su función, ya que determina cómo interactúa con otras moléculas y cómo realiza su actividad biológica.
AlphaFold utiliza redes neuronales artificiales para aprender de miles de ejemplos de estructuras proteicas conocidas y luego aplicar ese conocimiento a nuevas secuencias. El sistema es capaz de predecir la forma de una proteína con una precisión comparable a la de los métodos experimentales, pero en cuestión de minutos en lugar de meses o años. Esto supone un avance enorme para la ciencia, ya que permite acceder a información valiosa sobre millones de proteínas que aún no se han estudiado.
Pero AlphaFold no es el único sistema de IA que está cambiando el panorama del diseño de proteínas. Otros investigadores han ido más allá y han creado sistemas capaces de generar proteínas totalmente nuevas, que no existen en la naturaleza. Estos sistemas se basan en modelos generativos, que son capaces de crear contenido original a partir de datos existentes. Por ejemplo, hay modelos generativos que pueden crear imágenes, textos o música a partir de ejemplos previos.
Reliable protein-protein docking with AlphaFold, Rosetta and replica-exchange https://t.co/KYR0O3zHAW #bioRxiv
— bioRxiv (@biorxivpreprint) July 30, 2023
Uno de estos sistemas es Genie, creado por Mohammed AlQuraishi, biólogo molecular e investigador en IA de la Universidad de Columbia (Estados Unidos). Genie utiliza AlphaFold como base, pero le añade una capa adicional que le permite crear nuevas secuencias de aminoácidos y sus correspondientes estructuras. Genie funciona como un “diseñador” de proteínas, al que se le puede dar una función deseada y él genera una o varias proteínas que podrían cumplirla.
Por ejemplo, se le podría pedir a Genie que diseñe una proteína que se una a un receptor específico, o que tenga una actividad enzimática determinada. Genie buscaría entre las proteínas existentes las características que se relacionan con esa función y luego crearía nuevas combinaciones posibles. El resultado serían proteínas sintéticas, que podrían tener aplicaciones médicas o industriales.
Otro sistema similar es RoseTTAFold, desarrollado por investigadores del Instituto Médico Howard Hughes (Estados Unidos). RoseTTAFold también utiliza redes neuronales para predecir y diseñar estructuras proteicas, pero con una ventaja adicional: puede hacerlo sin necesidad de utilizar datos experimentales previos. Esto significa que puede generar proteínas completamente novedosas, sin basarse en ninguna referencia conocida.
RoseTTAFold se basa en un concepto llamado “transferencia de aprendizaje”, que consiste en aprovechar el conocimiento adquirido por un modelo en una tarea para aplicarlo a otra diferente. En este caso, RoseTTAFold utiliza un modelo entrenado para predecir las interacciones entre los átomos de una molécula para luego predecir las interacciones entre los aminoácidos de una proteína. De esta forma, puede crear estructuras proteicas coherentes y estables.
Los sistemas de IA generativa como Genie y RoseTTAFold abren un nuevo horizonte para el diseño de proteínas y la biología sintética. Estos sistemas podrían ayudar a crear nuevas terapias para enfermedades, nuevos materiales biológicos o nuevos organismos artificiales. Sin embargo, también plantean desafíos éticos y regulatorios, ya que implican la manipulación de la vida a nivel molecular. Por eso, es necesario un debate social y científico sobre los beneficios y los riesgos de estas tecnologías, así como sobre los límites y las responsabilidades de su uso.
https://twitter.com/paulynamagana/status/1683051190563602434
Con información de: DW