OpenAI quiere ser tu médico de confianza, disponible las 24 horas desde tu bolsillo

Publicado el

pintura expresionista de una mujer observando a un médico virtual en su móvil

OpenAI ha presentado HealthBench, un benchmark diseñado para medir cuán bien los modelos de inteligencia artificial entienden y responden a conversaciones médicas complejas. El objetivo no es sustituir al personal sanitario, sino ofrecer una herramienta de apoyo que potencie el acceso a información sanitaria fiable, contextual y útil para pacientes y profesionales.

HealthBench ha sido creado con la colaboración de 262 médicos de 60 países, quienes ayudaron a generar 5.000 escenarios clínicos realistas. Cada uno está acompañado de una rúbrica específica para evaluar las respuestas que generan los modelos de lenguaje, como ChatGPT o Claude.


Siete pilares clínicos

La evaluación cubre siete áreas médicas clave: desde el cuidado de emergencias y la gestión de la incertidumbre, hasta temas de salud global. Estas categorías permiten valorar si la IA puede adaptarse a contextos diversos, como diagnósticos urgentes, consejos preventivos o recomendaciones personalizadas según el entorno socioeconómico del paciente.

Por ejemplo, se mide si el modelo es capaz de explicar los síntomas de un infarto de forma comprensible para una persona sin formación médica, o si sabe sugerir una acción inmediata en caso de una reacción alérgica grave.


Resultados prometedores (pero con cautela)

De acuerdo con OpenAI, su modelo GPT-4.1 nano, a pesar de ser mucho más pequeño y barato que versiones anteriores, supera al GPT-4o de agosto de 2024 en tareas médicas. Incluso rinde mejor que alternativas como Claude 3.7 Sonnet o Gemini 2.5 Pro en varios aspectos.

Un dato que llama la atención es que, en muchos casos, las respuestas generadas por la IA superan en claridad y utilidad a las redactadas por médicos humanos. A partir de abril de 2025, según OpenAI, las correcciones humanas ya no mejoraban significativamente las respuestas generadas por sus modelos.

No obstante, esto no implica que la IA esté lista para reemplazar el juicio médico. Profesionales como el Dr. CN Manjunath, reconocido cardólogo indio, advierten que la exploración física sigue siendo indispensable. Aunque una IA pueda ayudar a interpretar síntomas o sugerir tratamientos, siempre es necesario contrastar con un especialista.


Historias de usuarios

En redes sociales, muchos comparten casos donde ChatGPT ha sido decisivo para entender afecciones persistentes. Desde dolores de espalda crónicos hasta problemas mandibulares difíciles de diagnosticar, algunos usuarios aseguran que la IA fue más efectiva que varios especialistas.

Esto ilustra el potencial de los modelos de lenguaje como apoyo a la consulta tradicional, especialmente cuando los pacientes se sienten perdidos entre síntomas vagos, largas listas de espera o explicaciones médicas incomprensibles.


Un movimiento estratégico

El interés de OpenAI por el sector salud se refleja también en nuevas ofertas de empleo enfocadas en salud, como ingenieros de software médico o investigadores especializados en IA sanitaria.

Este cambio también coincide con la reestructuración interna de la empresa: Fidji Simo ha sido nombrada CEO de Aplicaciones, permitiendo que Sam Altman se enfoque en investigación, computación y seguridad. Altman ha declarado en varias ocasiones que su entusiasmo más grande está en el potencial de la IA para fomentar descubrimientos científicos.


Competencia en el horizonte

OpenAI no está sola en esta carrera. Google ha desarrollado modelos como TxGemma, diseñados para acelerar el desarrollo terapéutico y la evaluación de compuestos farmacológicos. Su suite Med-Gemini aprovecha datos médicos anonimizados y capacidades multimodales para apoyar a médicos y pacientes.

Además, productos como MedLM y Search for Healthcare, disponibles en la nube de Google, ya están integrados en hospitales y centros de atención médica, proporcionando respuestas a consultas clínicas en tiempo real.

Por su parte, Anthropic ha lanzado el programa AI for Science, ofreciendo créditos de uso gratuito para investigaciones de alto impacto, centradas especialmente en biología y ciencias de la vida.


IA y longevidad: una nueva frontera

Karina Nguyen, investigadora en OpenAI, ha expresado que la IA puede extender la esperanza de vida al mejorar el acceso a la atención sanitaria y acelerar la investigación en longevidad. Otros referentes del sector, como Bryan Johnson, han destacado que los modelos de IA ya superan a médicos humanos en tareas de diagnóstico sin material de apoyo.

La visión compartida por estos expertos apunta a un futuro donde la IA no solo acompaña, sino que transforma la práctica clínica, ayudando a prevenir enfermedades antes de que aparezcan y personalizando el tratamiento de manera precisa.


Usar la IA con criterio

Aunque el progreso es indudable, el mensaje general es de equilibrio: usar la IA como una herramienta complementaria, no como reemplazo del médico. La clave está en empoderar al paciente con información clara, validada y contextual, sin caer en la tentación de automedicarse o evitar la consulta presencial.

ChatGPT puede ser tu primer paso, pero nunca debe ser el único.