Mientras los consumidores siguen atentos la competencia entre OpenAI y Google en el mundo de la inteligencia artificial generativa, Anthropic ha ejecutado una estrategia mucho más enfocada y calculada: apostar por la codificación en el entorno empresarial. Con su reciente lanzamiento de Claude 3.7 Sonnet, la compañía ha establecido nuevos estándares en benchmarks de desarrollo de software y ha fortalecido su posición como el modelo de lenguaje más relevante para programadores y empresas.
Claude 3.7: Un salto en rendimiento para la programación
El lanzamiento de Claude 3.7 Sonnet, el pasado 24 de febrero, marcó un hito en la industria. Este modelo logró una puntuación del 70.3% en SWE-bench, un benchmark ampliamente respetado que mide la capacidad de un modelo de IA para resolver problemas de desarrollo de software en escenarios del mundo real. Para poner esto en perspectiva, su competencia más cercana, OpenAI o1, obtuvo un 48.9%, mientras que DeepSeek-R1 alcanzó un 49.2%.
El modelo no solo ha destacado en pruebas sintéticas, sino que los desarrolladores también han validado su superioridad en aplicaciones del día a día. Plataformas como Reddit han visto un aumento en comentarios favorables a Claude 3.7 en comparación con otras alternativas como Grok 3 de xAI. Incluso Manus, el nuevo agente chino multiuso que recientemente generó revuelo en la industria, se desarrolló en gran medida sobre Claude 3.7, demostrando su solidez en tareas autónomas.
Claude Code: El nuevo asistente en la terminal
Junto con la presentación de Claude 3.7 Sonnet, Anthropic también lanzó Claude Code, un agente de codificación que funciona directamente en la línea de comandos. Esta herramienta se suma a la funcionalidad lanzada en octubre del año pasado, Computer Use, que permite a Claude interactuar con la computadora del usuario, abrir aplicaciones y realizar tareas complejas sin necesidad de intervención manual.
A diferencia de otras empresas que buscan cubrir el mayor número de funcionalidades posibles, Anthropic ha optado por un enfoque más refinado: centrarse en resolver problemas empresariales a través de la codificación, dejando de lado funciones que no aportan un alto retorno de inversión, como la búsqueda en la web.
La experiencia en el mundo real: probando Claude para programar
Para evaluar las capacidades reales de Claude en la programación, se realizaron pruebas con tres enfoques diferentes para crear una base de datos de artículos de VentureBeat:
- Claude 3.7 en la aplicación de Anthropic: Se mostró como un excelente asistente, ofreciendo una guía paso a paso para integrar una base de datos con PostgreSQL o Airtable.
- Cursor, el editor de código impulsado por Claude: Este entorno permitió una mayor automatización, aunque su necesidad de confirmaciones en cada paso hizo el proceso algo tedioso.
- Claude Code en la terminal: Proporcionó una solución más simple utilizando SQLite para almacenar los datos, aunque con menos funcionalidades avanzadas.
El resultado fue revelador: incluso un usuario sin experiencia en programación pudo construir aplicaciones funcionales con estas herramientas, lo que confirma el enorme potencial de Claude como un agente democratizador del desarrollo de software.
La estrategia de Anthropic: Focalización en la empresa
Anthropic no ha dejado su enfoque empresarial al azar. Según datos filtrados, la compañía proyecta alcanzar 34.5 mil millones de dólares en ingresos para 2027, con un 67% de estos ingresos provenientes de su negocio de APIs, dominado por aplicaciones de codificación para empresas. Solo en el último trimestre de 2024, su ingreso por herramientas de codificación creció un 1000%.
El impacto de esta estrategia ya se está sintiendo. Cursor, el editor de código basado en Claude, alcanzó los 100 millones de dólares en ingresos recurrentes anuales en solo 12 meses, demostrando que hay un mercado creciente para herramientas de desarrollo asistidas por IA.
Competencia: Microsoft, OpenAI, Google y los modelos Open Source
Anthropic no está solo en la carrera por el dominio del desarrollo de software asistido por IA. Microsoft sigue liderando con GitHub Copilot, que ya cuenta con 1.3 millones de usuarios pagos. Sin embargo, la misma Microsoft ha reconocido el valor de Claude, permitiendo que los usuarios de Copilot elijan los modelos de Anthropic como alternativa a los de OpenAI.
Google también ha tratado de competir, ofreciendo su herramienta Code Assist de forma gratuita, aunque parece ser más un movimiento defensivo que una estrategia de diferenciación real.
Por otro lado, el movimiento Open Source está ganando tracción. Empresas como AT&T, Goldman Sachs y DoorDash están adoptando modelos de código abierto como Llama de Meta, que ofrecen mayor personalización y control.
El futuro del desarrollo con IA
Para las empresas, adoptar herramientas como Claude ya no es una opción, sino una necesidad. Según datos de GitHub, el 92% de los desarrolladores en EE.UU. ya usan herramientas de IA en su trabajo. Empresas que retrasen su adopción podrían quedar en desventaja frente a competidores que están acelerando sus ciclos de desarrollo con estos agentes de IA.
Desde WWWhatsnew, creemos que este momento marca un punto de inflexión en el desarrollo de software empresarial. La IA no reemplazará a los programadores, sino que los empoderará para centrarse en la arquitectura y la innovación. Empresas que establezcan entornos de experimentación seguros y fomenten el uso de estas herramientas estarán mejor posicionadas para el futuro.
El 2025 podría ser recordado como el año en que los agentes de codificación se convirtieron en herramientas imprescindibles para las empresas, y por ahora, Claude está liderando la revolución.