xAI lanza Grok Build, su agente de código CLI, como rival directo de Claude Code

Publicado el

xAI lanza Grok Build, su agente de código CLI, como rival directo de Claude Code

xAI acaba de entrar en la guerra de los agentes de programación con Grok Build, un CLI agéntico que lleva la IA directamente al terminal del desarrollador. Lo anuncia la propia compañía el 14 de mayo de 2026: disponible en beta temprana para suscriptores SuperGrok Heavy, el producto apunta a competir de tú a tú con Claude Code de Anthropic y Codex CLI de OpenAI. Elon Musk, que durante meses había reconocido públicamente que xAI «se había quedado atrás» en programación, acompañó el lanzamiento con múltiples llamadas públicas a probar la beta en X. Lo que hay que entender rápido: Grok Build no es un chatbot que sugiere código. Es un agente que planifica, escribe, ejecuta y corrige en ciclos autónomos desde la terminal, sin que el desarrollador tenga que cambiar de ventana.

¿Qué puede hacer Grok Build desde el terminal?

Grok Build se instala con un único comando —curl -fsSL https://x.ai/cli/install.sh | bash— y se activa con las credenciales de SuperGrok Heavy. A partir de ahí, el agente puede planificar proyectos, escribir y editar archivos, ejecutar comandos de shell, gestionar dependencias, lanzar pruebas y construir aplicaciones completas desde instrucciones en lenguaje natural.

El modelo que corre debajo es Grok 4.3 beta con arquitectura de 16 agentes en modo Heavy y una ventana de contexto de 2 millones de tokens, suficiente para tener una base de código entera en memoria mientras trabaja. La característica diferenciadora que más ha generado conversación es el Plan Mode: antes de ejecutar cualquier cambio, Grok Build presenta un plan de pasos numerados que el desarrollador puede aprobar, comentar o reescribir por completo. Solo después de la aprobación se aplican los cambios, que aparecen como diffs limpios.

Para tareas grandes, la herramienta puede lanzar hasta 8 subagentes concurrentes que trabajan en paralelo —documentación, búsqueda, escritura de código, tests— sin bloquearse entre sí. Soporta además modo headless con la bandera -p para integrarlo en scripts y pipelines de CI/CD, y ofrece soporte completo para ACP (Agent Coordination Protocol), que permite construir bots propios y flujos de orquestación de agentes. Integra también worktrees de Git y compatibilidad con servidores MCP, AGENTS.md, plugins y hooks, los mismos estándares del ecosistema Claude Code.

Que xAI lanzara en su día Grok Studio como entorno creativo para programar y colaborar no es casual: Grok Build es la apuesta terminal-first del mismo ecosistema, pero orientada al desarrollador profesional, no al usuario casual.

¿Quién puede acceder y cuánto cuesta?

La beta está restringida a suscriptores de SuperGrok Heavy, cuyo precio estándar es de 300 dólares al mes (unos 282 euros). Es el plan más caro entre los grandes proveedores de IA en 2026. xAI ofrece un precio introductorio de 99 dólares al mes durante los primeros seis meses, un descuento del 67%. Superado ese periodo, el coste vuelve al nivel estándar.

Esto sitúa a Grok Build en un nicho deliberado: no es una herramienta de adopción masiva, sino un producto para power users que ya pagan la suscripción más alta de Grok y están dispuestos a probar algo en beta activa. El CLI incluye el comando /feedback para enviar bugs y sugerencias directas al equipo de xAI, lo que deja claro que el lanzamiento es una fase de iteración acelerada, no un producto terminado.

Desde que Musk admitió bajo juramento en el juicio contra Altman que xAI usó destilación con modelos de OpenAI para entrenar Grok, las preguntas sobre la calidad real del modelo base son legítimas. La beta es la respuesta práctica: muéstramelo funcionando en código real.

¿En qué punto está la carrera de los agentes de código?

El mercado de herramientas de coding agéntico ha madurado de forma radical en el último año. Claude Code generó más de mil millones de dólares en ingresos en sus primeros seis meses, convirtiéndose en el estándar de referencia para desarrolladores profesionales. OpenAI integra Codex CLI en su plataforma. GitHub tiene su Agent HQ con soporte de múltiples agentes. Cursor acaba de lanzar Composer 2. Microsoft tiene Copilot con profunda integración en VS Code.

En ese contexto, Grok Build entra tarde pero no sin argumentos reales. El Plan Mode antes de ejecutar es una mejora UX que ninguno de los competidores directos ofrece en esa forma. El soporte nativo de subagentes en paralelo tiene valor para refactorizaciones grandes. Y el hecho de que xAI haya construido compatibilidad con los estándares del ecosistema Claude Code —AGENTS.md, MCP, plugins, hooks— reduce la fricción para equipos que ya trabajan en ese entorno.

La duda que permanece: si Grok 4.3 Heavy rinde a la altura de lo que el mercado exige en uso diario. A 300 dólares al mes, eso es demasiado dinero para apostar sin datos.

Mi valoración

Llevo siguiendo el ecosistema de agentes de código desde las primeras versiones de GitHub Copilot, y lo que más me convence de Grok Build no es el modelo sino la arquitectura UX del Plan Mode. Que el agente te muestre el plan antes de tocar nada —y te permita reescribirlo— es exactamente el tipo de control que un desarrollador senior quiere sobre una herramienta autónoma. Es la diferencia entre un asistente que actúa y uno que consulta.

Lo que más me preocupa es el acceso restringido: limitar la beta a 300 dólares al mes hace casi imposible la comparación pública con Claude Code o Codex en condiciones reales. Los foros técnicos que mueven la adopción empresarial no van a poder evaluarlo en serio hasta que el precio baje o el acceso se amplíe sustancialmente.

Lo más estructuralmente significativo es que xAI está apostando por la integración sobre el liderazgo en benchmarks. Compatibilidad con MCP, AGENTS.md, worktrees: todo dice «queremos encajar en tu flujo existente», no «somos mejores». Es más madura de lo esperado para una empresa que hasta hace meses estaba en el sótano de los rankings de coding. La pregunta a 12 meses no es si Grok Build es mejor que Claude Code. Es si xAI tiene velocidad de iteración suficiente para sostenerse mientras Anthropic y OpenAI no se quedan quietos. Mi predicción: captará adopción entre usuarios SuperGrok ya comprometidos, pero no moverá a equipos que construyeron flujos sobre Claude Code o Codex hasta que llegue un precio mucho menor o un resultado de benchmark difícil de ignorar.

Preguntas frecuentes

¿Grok Build está disponible para suscriptores de Grok normal?

No. Grok Build está restringido al plan SuperGrok Heavy, que cuesta 300 dólares al mes (unos 282 euros). Hay un precio introductorio de 99 dólares al mes durante los primeros seis meses, un ahorro del 67%, pero la herramienta no está incluida en ningún plan de precio inferior. xAI no ha confirmado si habrá acceso más amplio ni en qué plazo.

¿En qué se diferencia el Plan Mode de Grok Build de lo que ya ofrecen Claude Code o Codex?

Plan Mode muestra un plan detallado de pasos antes de ejecutar cualquier cambio de código, y el desarrollador puede aprobar, editar o rechazar ese plan antes de que el agente actúe. Claude Code ejecuta acciones tras confirmación pero sin un plan estructurado por pasos previo. Es una diferencia de paradigma de interacción: más control explícito antes de la ejecución a cambio de algo más de fricción en el flujo.

¿Qué significa que Grok Build soporte ACP?

ACP (Agent Coordination Protocol) es un protocolo que permite que Grok Build construya bots propios y flujos de orquestación de múltiples agentes de IA. En la práctica, equipos técnicos pueden integrar Grok Build en pipelines de automatización complejos —no solo usarlo como herramienta interactiva—, y en modo headless ejecutarlo dentro de scripts de CI/CD sin intervención humana.