Cómo configurar doble pantalla en Windows y Mac: qué monitor comprar, conexiones, organización de ventanas y trucos para máxima productividad laboral.
GPT-5.5 supera a Claude Opus 4.7 en Terminal-Bench: la batalla del coding agéntico se decide en los benchmarks de tareas reales
OpenAI lanzó GPT-5.5 («Spud») la semana pasada con cifras que reordenan el liderazgo en programación agéntica. Aamir Khollam lo cubre en Interesting Engineering desde el ángulo competitivo: GPT-5.5 alcanza 82,7% en Terminal-Bench 2.0, el benchmark estándar para medir la habilidad de un agente de IA de operar autónomamente en una terminal Unix completando tareas reales de desarrollo. Ese resultado desplaza a Claude Opus 4.7 de Anthropic, que dominaba el segmento desde su lanzamiento en abril. Es la primera vez en 18 meses que OpenAI recupera el liderazgo declarado en coding agéntico. Continúa leyendo «GPT-5.5 supera a Claude Opus 4.7 en Terminal-Bench: la batalla del coding agéntico se decide en los benchmarks de tareas reales»