Claude Opus 4.5: el nuevo referente en IA para programación, agentes y tareas cotidianas

Anthropic ha presentado Claude Opus 4.5, su modelo más avanzado hasta la fecha, consolidándose como una herramienta de referencia en el mundo de la inteligencia artificial aplicada al desarrollo de software, uso de agentes inteligentes y tareas cotidianas como la gestión de hojas de cálculo y documentos complejos.

Opus 4.5 no solo destaca por su potencia, sino también por su eficiencia. Comparado con sus predecesores, ofrece mejoras tangibles en rendimiento, seguridad y capacidad de razonamiento, lo que lo posiciona como un aliado versátil para desarrolladores, empresas y usuarios comunes.

Precisión y eficiencia en ingeniería de software

En pruebas exigentes como SWE-bench Verified, orientadas a medir el rendimiento en escenarios reales de ingeniería de software, Claude Opus 4.5 ha superado a todos los modelos actuales, incluyendo candidatos humanos. Logró resolver correctamente más tareas dentro de un límite de tiempo estricto, demostrando no solo rapidez, sino también un juicio técnico afinado.

Este tipo de resultados abren la puerta a reflexiones sobre el papel que la IA desempeñará en profesiones como la programación, donde la capacidad de resolver problemas complejos bajo presión es fundamental. Aunque estas pruebas no sustituyen las habilidades humanas como la colaboración o la intuición adquirida con años de experiencia, sí muestran cómo los modelos avanzados pueden complementar tareas críticas.

Inteligencia práctica: resolviendo problemas del mundo real

Uno de los aspectos más interesantes de Opus 4.5 es su habilidad para encontrar soluciones creativas en situaciones aparentemente bloqueadas. En una prueba de simulación de un agente de servicio al cliente de una aerolínea, el modelo encontró una forma legítima de modificar una reserva no flexible: primero proponiendo una mejora de cabina, lo cual permitía luego realizar el cambio de vuelo.

Este tipo de razonar, que va más allá del cumplimiento estricto de reglas, refleja una comprensión más profunda de las restricciones y oportunidades dentro de sistemas complejos. Aunque la evaluación automática calificó la respuesta como un fallo, la estrategia fue vista por expertos como una muestra de ingenio práctico.

Avances significativos en seguridad y alineación

En cuanto a seguridad y alineación con intenciones humanas, Opus 4.5 también representa un avance notable. Ha demostrado una mayor resistencia frente a ataques por «inyección de instrucciones», una técnica que busca manipular al modelo mediante indicaciones encubiertas. Este tipo de robustez es esencial para entornos donde se procesan datos sensibles o se espera que el modelo mantenga un comportamiento ético incluso ante intentos maliciosos.

Según Anthropic, este modelo es el más seguro que han desarrollado hasta ahora, y posiblemente el más alineado entre todos los modelos disponibles en el mercado. Esto es especialmente relevante para empresas que necesitan delegar tareas críticas sin comprometer la seguridad de su información o procesos.

Menor consumo de recursos, mejores resultados

Uno de los cambios más prácticos introducidos por Claude Opus 4.5 es su capacidad de llegar a conclusiones con menos tokens, es decir, utilizando menos recursos computacionales. Gracias a nuevas funciones como el parámetro de «esfuerzo» en la API, los desarrolladores pueden elegir entre respuestas más rápidas y económicas o resultados más profundos y detallados, según lo requiera la tarea.

Por ejemplo, en el mismo benchmark de SWE-bench, Opus 4.5 logró igualar el rendimiento de Sonnet 4.5 utilizando un 76% menos de tokens. En su configuración de máximo esfuerzo, superó el rendimiento anterior y redujo el consumo en casi la mitad. Esto implica mayor eficiencia en la práctica, especialmente para aplicaciones de escala empresarial donde el coste por uso es un factor relevante.

Agentes más inteligentes y colaborativos

El modelo también se ha optimizado para funcionar con agentes inteligentes de larga duración, que pueden ejecutar tareas complejas y prolongadas sin perder el hilo. Claude Opus 4.5 puede coordinar subagentes y manejar tareas distribuidas con eficacia, lo que abre la posibilidad de construir sistemas automatizados más sofisticados y autosuficientes.

En evaluaciones internas, la combinación de herramientas como manejo de contexto, uso de memoria y control de esfuerzo mejoró el rendimiento en investigaciones profundas en un 15%. Esto permite, por ejemplo, automatizar procesos de investigación, análisis de datos o mantenimiento de software con menos supervisión humana.

Mejoras en la experiencia de usuario

Claude Opus 4.5 también trae cambios significativos en su uso dentro de las aplicaciones de consumo. Las conversaciones largas ya no se interrumpen abruptamente: el modelo resume de forma automática el contexto anterior para poder seguir interactuando sin perder información relevante. Esta función es especialmente útil para quienes trabajan durante horas en proyectos dentro del chat.

Por otro lado, Claude Code incorpora dos mejoras clave. En primer lugar, el modo «Plan» ahora genera estrategias más precisas, construyendo un archivo editable antes de ejecutar el código. En segundo lugar, esta herramienta está disponible en la aplicación de escritorio, lo que permite ejecutar sesiones locales y remotas en paralelo. De este modo, un usuario puede tener a un agente corrigiendo errores, otro documentando y otro investigando en GitHub, todo al mismo tiempo.

En el navegador, Claude para Chrome se ha abierto a todos los usuarios del plan Max, permitiendo a la IA realizar tareas a través de varias pestañas. Y en el caso de Claude para Excel, el acceso beta se ha extendido a usuarios Max, Team y Enterprise, facilitando el trabajo con hojas de cálculo desde un entorno familiar pero potenciado con IA.

Más accesible para desarrolladores y empresas

Claude Opus 4.5 está disponible en la API de Anthropic, aplicaciones propias y principales plataformas en la nube, incluyendo Amazon Bedrock y Google Cloud. El precio actual es de 5 dólares por millón de tokens para entrada y 25 dólares para salida, lo que permite a equipos y organizaciones integrar estas capacidades sin que el coste se dispare.

Asimismo, se han eliminado los límites específicos del modelo Opus para usuarios Premium de los planes Max y Team, ajustando las cuotas para que los usuarios puedan incorporar esta versión en su rutina diaria sin interrupciones.