OpenAI publicó el 17 de junio de 2026 LifeSciBench, un benchmark de evaluación de modelos de IA para tareas de investigación en ciencias de la vida escrito y revisado por científicos con doctorado y experiencia en biotecnología y farmacología. Es el primer benchmark diseñado específicamente para medir si un modelo de IA puede hacer el tipo de trabajo real que hacen los investigadores científicos: interpretar evidencia incompleta, diseñar experimentos, evaluar riesgo traslacional y tomar decisiones bajo incertidumbre. No preguntas de trivia biológica. Investigación aplicada real. El benchmark incluye 750 tareas, 1.062 artefactos (figuras, PDFs, tablas, secuencias, archivos de estructura molecular), contribuciones de 173 científicos y 19.020 criterios de rúbrica para evaluación. Lo publica el blog oficial de OpenAI el 17 de junio. Continúa leyendo «OpenAI publica LifeSciBench: 750 tareas escritas por científicos para medir si la IA puede hacer investigación real en biología»