La ingeniería de proteínas ha sido un campo lleno de complejidades y costos elevados. Sin embargo, Microsoft ha lanzado recientemente EvoDiff, un marco de trabajo en código abierto que promete simplificar este proceso.
Diseñar una proteína en el laboratorio es un proceso que consume tanto recursos computacionales como humanos. Tradicionalmente, se necesita una estructura de proteína que pueda realizar una tarea específica en el cuerpo, seguida de una secuencia de aminoácidos que se «pliegue» en esa estructura. Este «plegado» es crucial para la funcionalidad de la proteína.
Qué es EvoDiff
EvoDiff es un marco de trabajo de propósito general que genera proteínas de alta fidelidad a partir de una secuencia de proteínas dada. Lo que lo hace único es que no requiere información estructural sobre la proteína objetivo, eliminando así el paso más laborioso del proceso tradicional.
El corazón de EvoDiff es un modelo de 640 millones de parámetros entrenado en datos de diversas especies y clases funcionales de proteínas. Utiliza un modelo de difusión, similar en arquitectura a modelos generadores de imágenes modernos, para refinar secuencias de proteínas.
Las aplicaciones de EvoDiff son variadas, desde la creación de enzimas para nuevos métodos terapéuticos y de administración de medicamentos hasta enzimas para reacciones químicas industriales. También puede llenar «huecos» en diseños de proteínas existentes y generar proteínas «desordenadas» que tienen roles importantes en biología y enfermedad.
Es crucial señalar que la investigación detrás de EvoDiff aún no ha sido revisada por pares. El equipo de desarrollo reconoce que hay mucho más trabajo de escalado por hacer antes de que el marco pueda ser utilizado comercialmente.
Más información en GitHub y en TC