Las proteínas son las piezas fundamentales de la vida y lo son por algo que no entendemos. Son engranajes moleculares que deben encajar a la perfección con el resto del sistema y por eso, cada proteína tiene una estructura tridimensional única que está íntimamente relacionada con su función. Sin esa estructura, sin esa forma característica, las proteínas no son nada. O peores que nada. Incluso el más pequeño reordenamiento de las cadenas de aminoácidos que forman estas moléculas puede tener efectos devastadores en nuestra salud.
Sin embargo, esas estructuras siguen siendo un enorme misterio: somos incapaces de entender correctamente de qué depende el ordenamiento espacial de las proteínas y, por eso mismo, la secuencia de aminoácidos de una proteína no nos dice absolutamente nada (aunque sabemos a ciencia cierta desde hace más de 50 años que las instrucciones están ahí). Es el equivalente en biología molecular de mirar los planos de una casa y ser incapaz de predecir cómo será su estructura.
Tenemos alternativas, pero todas son costosas, caras y muy complejas. Son un infierno a nivel práctico. Por ello, desde 1994, decenas de grupos de investigación de todo el mundo se reúnen en el CASP (Critical Assessment of Techniques for Protein Structure Prediction), una competición bienal para poner a prueba los algoritmos predictores que se estaban desarrollando. Pues bien, el AlphaFold 2 de DeepMind acaba de pulverizar todos los récords anteriores y ha conseguido predecir la estructura de una proteína con exactitud muy cercana a la de los métodos tradicionales de cristalografía de rayos X y espectroscopia de RMN. ¿Qué significa esto y qué conlleva?
¿Qué ha hecho DeepMind?
Hasta el año 2016 (el primero en el que participó el laboratorio de inteligencia artificial de Google, DeepMind), los algoritmos habían conseguido, como mucho 40 puntos sobre 100 en las evaluaciones que se venían realizando. Aquel año, AlphaFold rozó los 60. Ahora, solo dos años después, se ha situado en 87 puntos de media. Es decir, ya toca con los dedos los 90 puntos; cifra que se considera equivalente a las técnicas habituales que determinan la estructura experimentalmente (mirando la ubicación de cada átomo en relación con otro en la molécula de las proteínas).
La dinámica de CASP es sencilla. Los organizadores facilitan la secuencia de una proteína a los participantes y, posteriormente, evalúan las predicciones de estos frente a la estructura determinada con técnicas tradicionales como la cristalografía de rayos X y la espectroscopia de RMN. En la última ronda del CASP de este año, AlphaFold 2 determinó la forma de casi dos tercios de las proteínas con una precisión comparable a la de las pruebas de laboratorio.
Y, según los organizadores, la precisión de la predicciones estructurales del tercio restante es también muy alta (aunque no llega a ese nivel). Los resultados son impresionantes, aunque viendo el enorme salto que ha dado el algoritmo de aprendizaje profundo de DeepMind es inevitable pensar que estamos solo en el principio. Al fin y al cabo, AlphaFold 2 ha podido hacer en cuestión de días lo que podría llevar años en un laboratorio (y únicamente alimentándose de información sobre las estructuras de las proteínas que ya teníamos).
¿Qué implica todo esto?
La estructura tridimensional de una proteína es mucho más que un divertimento para biólogos y expertos en apredizaje profundo. Conocer su estructura es fundamental para comprender miles de enfermedades como el cáncer, las neuropatías, las enfermedades raras o las infecciosas. También sería una herramienta revolucionaria en el diseño de fármacos. Solo hay que pensar que la piedra de toque del COVID-19 se asienta en una sola proteína que tiene en su superficie, la de espiga, y la mayor parte de vacunas y tratamientos se centran en ella.
Eso sí. Esto es solo un primer paso. Impresionante, pero solo uno. Todavía tenemos que averiguar cómo se unen varias proteínas, cómo éstas interactúan con otras moléculas (como el ADN y el ARN) y cómo podemos usar este conocimiento para exprimir todo su potencial biomédico. Los resultados de AlphaFold2 son espectaculares y han abierto una puerta que lleva 50 años cerrada. Detrás, si todo va bien, nos espera una nueva revolución biomédica.