OpenAI lanza GPT-Rosalind, su primer modelo de IA específico para ciencias de la vida: diseñado para acelerar el descubrimiento de fármacos con Amgen, Moderna y Thermo Fisher como socios

Publicado el

Interfaz de OpenAI Codex con el modelo GPT-Rosalind para ciencias de la vida y descubrimiento de fármacos

OpenAI ha presentado GPT-Rosalind, su primer modelo de IA diseñado específicamente para un dominio científico: ciencias de la vida, bioquímica, genómica e ingeniería de proteínas. Nombrado en honor a Rosalind Franklin (la cristalógrafa cuyo trabajo fue fundamental para descubrir la estructura del ADN), el modelo está disponible como research preview en ChatGPT, Codex y la API de OpenAI, pero el acceso está restringido a un programa de acceso confiable para clientes empresariales verificados en Estados Unidos. Los socios de lanzamiento incluyen a Amgen, Moderna, Thermo Fisher Scientific y el Allen Institute. OpenAI también trabaja con el Laboratorio Nacional de Los Álamos en diseño de proteínas y catalizadores guiado por IA. La cobertura viene de TNW, Bloomberg, Axios, Quartz, Euronews y MarkTechPost.

GPT-Rosalind no es un modelo general con un plugin de biología añadido. Es un modelo entrenado y evaluado específicamente para las tareas de flujo de trabajo que consumen la mayor parte del tiempo en investigación farmacéutica: síntesis de evidencia, generación de hipótesis, planificación experimental, predicción de secuencia a función, diseño de clonación molecular e interpretación de literatura. Joy Jiao, responsable de investigación en ciencias de la vida de OpenAI, dijo a reporteros que «no creemos que la IA pueda crear nuevos tratamientos por sí sola, pero sí pensamos que hay una oportunidad real de ayudar a los investigadores a avanzar más rápido a través de las partes más complejas y lentas del proceso científico». El desarrollo de un fármaco en EE.UU. tarda entre 10 y 15 años de media; GPT-Rosalind busca comprimir las fases iniciales.

Junto al modelo, OpenAI lanza un plugin de investigación en ciencias de la vida para Codex que conecta los modelos a más de 50 herramientas científicas y fuentes de datos, incluyendo bases de datos de genética humana, repositorios de genómica funcional, herramientas de estructura de proteínas y pipelines computacionales multiómicas. El plugin convierte a Codex en un entorno donde un investigador puede consultar una base de datos de proteínas, cruzar con literatura reciente, diseñar un protocolo de clonación molecular y predecir el comportamiento de una secuencia de ARN en un entorno celular, todo en una misma interfaz.

Los benchmarks publicados son significativos. En BixBench (una prueba de bioinformática y análisis de datos reales), GPT-Rosalind obtuvo la puntuación más alta entre los modelos con resultados publicados. En una evaluación con la empresa de terapia génica Dyno Therapeutics, usando secuencias de ARN no publicadas y previamente no vistas (para evitar contaminación de benchmark), los mejores envíos del modelo se situaron por encima del percentil 95 de expertos humanos en predicción de secuencia a función, y alrededor del percentil 84 en generación de secuencias. Estos números requieren contexto: superan a la mayoría de investigadores pero no a los mejores especialistas, y se obtuvieron en condiciones controladas que pueden no reflejar la complejidad del trabajo real en laboratorio.

El acceso restringido responde a preocupaciones de doble uso legítimas. Un modelo entrenado profundamente en secuencias biológicas y capaz de razonamiento avanzado sobre proteínas y ARN podría teóricamente ser usado para diseñar patógenos peligrosos. Más de 100 científicos publicaron este año un llamamiento para controles más estrictos sobre datos biológicos de IA. La estructura de acceso verificado de OpenAI exige que las organizaciones demuestren que trabajan en mejorar resultados de salud humana, realizan investigación legítima y mantienen controles de seguridad y gobernanza sólidos. Es el mismo enfoque que OpenAI aplica a GPT-5.4-Cyber y que Anthropic usa con Mythos: acceso restringido a herramientas potencialmente peligrosas.

Mi valoración: GPT-Rosalind marca el inicio de una tendencia que veremos crecer: modelos de IA diseñados para dominios específicos en lugar de ser generalistas. Un modelo que sabe de bioquímica, genómica y farmacología a un nivel que supera al percentil 95 de expertos humanos en algunas tareas tiene valor real en un sector donde cada mes de aceleración en el descubrimiento de un fármaco puede traducirse en millones de vidas salvadas (o en miles de millones de dólares para la farmacéutica, según cómo lo mires).

La competencia con Google DeepMind (cuyo AlphaFold ganó el Nobel de Química en 2024 por predicción de estructura de proteínas) y con Anthropic (que ha expandido sus herramientas de IA para ciencia y salud) sitúa las ciencias de la vida como el próximo campo de batalla de la IA, después del código y la productividad empresarial. Precedence Research estima que la inversión de la industria farmacéutica en IA alcanzará los 2.510 millones de dólares en 2026 y los 16.490 millones en 2034. OpenAI no es la primera en este espacio, pero sí la primera en lanzar un modelo de razonamiento completo (no solo predicción de estructura) con integración directa a herramientas de laboratorio.

La decisión de restringir el acceso es coherente con la tendencia de 2026 de «modelos poderosos con acceso controlado». OpenAI hace con GPT-Rosalind en biología lo mismo que hace con GPT-5.4-Cyber en ciberseguridad y lo que Anthropic hace con Mythos en seguridad informática: reconocer que la capacidad implica riesgo y que el acceso universal no es siempre la opción más responsable. El debate filosófico entre acceso abierto (democratización) y acceso restringido (seguridad) seguirá definiendo la industria durante años.

Preguntas frecuentes

¿Puedo usar GPT-Rosalind? Solo si trabajas en una organización que cumple los requisitos del programa de acceso confiable de OpenAI (investigación legítima en ciencias de la vida, controles de seguridad, sede en EE.UU.). ¿Reemplaza a los científicos? No. OpenAI lo posiciona como un «compañero de laboratorio» que automatiza tareas repetitivas (revisión de literatura, limpieza de datos) para que los investigadores se centren en estrategia clínica e innovación. ¿Cómo se compara con AlphaFold de Google? AlphaFold se especializa en predicción de estructura de proteínas. GPT-Rosalind es más amplio: cubre síntesis de evidencia, planificación experimental, genómica y múltiples tareas de flujo de trabajo científico.