Los agentes de IA ya no esperan que les preguntes: el «loop» convierte la IA en un proceso que nunca se detiene

El creador de Claude Code acaba de decir en voz alta lo que muchos en el sector pensaban pero no formulaban con claridad: después de la IA agentica, el siguiente salto es el loop. Un swarm de agentes corriendo en segundo plano de forma permanente, sin techo de tokens, sin esperar órdenes. Lo contó Boris Cherny en la conferencia @Scale de Meta este viernes, y la respuesta del público fue la pregunta justa: ¿es el próximo hype cycle o es real?

La respuesta de Cherny fue contundente: «Hace dos años escribíamos código a mano. Empezamos la transición para que los agentes escribieran el código. Y ahora estamos transitando hacia que agentes les pidan a otros agentes que escriban el código. El paso de código a agentes fue enorme. El loop es igual de importante.»

Cherny no habló en abstracto. Detalló dos agentes que mantiene corriendo de forma continua en su propio flujo de trabajo: uno busca permanentemente formas de mejorar la arquitectura del código; otro detecta abstracciones duplicadas que se pueden unificar. Ambos abren pull requests como cualquier otro desarrollador del equipo. Y como el código cambia constantemente, nunca terminan.

Qué es exactamente un loop agentico

El concepto no es nuevo en la teoría de sistemas. Los bucles recursivos —funciones que se llaman a sí mismas hasta que una condición de parada se cumple— son materia de primer año de informática. Lo que cambia aquí es que la condición de parada no es determinista: es un subagente que decide cuándo el trabajo está suficientemente bien hecho. Eso lo convierte en algo radicalmente diferente de un cron job o un pipeline automatizado.

El ejemplo más citado en la comunidad es el Ralph Loop (bautizado así por el meme de Ralph Wiggum), que básicamente resume todo el trabajo realizado y pregunta al modelo si ha cumplido su objetivo. Es una forma de mantener al agente centrado cuando se dispersa tras muchas iteraciones —como resetear la memoria de trabajo de alguien que lleva horas resolviendo un problema complejo. La capacidad de los agentes de IA para coordinarse entre sí ya tiene un lado oscuro documentado, pero también un potencial que la industria empieza a cuantificar.

El investigador de OpenAI Noam Brown lo formuló así a principios de junio: los modelos actuales pueden resolver prácticamente cualquier problema si se les da suficiente cómputo. El loop es esa idea llevada al extremo productivo: si el problema es mejorar un codebase, el agente puede seguir haciendo mejoras incrementales mientras haya cómputo disponible, sin techo aparente.

La economía del loop y por qué le conviene a Anthropic

Aquí es donde hay que ser directos. Un loop agentico consume tokens a un ritmo radicalmente superior al de un chatbot de preguntas y respuestas. Y como la gracia del loop es que no tiene fin —corre mientras el modelo tenga trabajo que hacer— tampoco tiene límite de gasto. Cherny lo sabe, y lo dice sin eufemismos: es caro. Para alguien que usa Claude Code con una suscripción de consumo, un loop de mejora de código corriendo durante días puede generar facturas que superen holgadamente los 1.000 euros al mes.

Para Anthropic, que está en el negocio de vender tokens, el modelo es excelente. Para todos los demás, la clave está en el ROI: si el agente realmente mejora el código más rápido de lo que costaría hacerlo un ingeniero humano, el gasto se justifica. En problemas de «hill climbing» —como optimizar un codebase existente— donde hay un gradiente claro de mejora, el argumento funciona.

Donde se complica es en las métricas de evaluación. ¿Cómo sabe el agente que ha mejorado algo? ¿Quién define el criterio de éxito? El modo automático de Claude Code ya intenta resolver parte de este problema con clasificadores que deciden qué acciones son seguras ejecutar sin supervisión humana, pero el propio Anthropic advierte que «no elimina el riesgo, lo reduce». Un loop sin supervisión es un clasificador al que le delegas la definición de «suficientemente bueno».

De los agentes a los loops: la aceleración que nadie había presupuestado

Lo que Cherny describió en la conferencia de Meta es la tercera fase de una transición que empezó hace dos años. Primero: los humanos escriben código. Segundo: los agentes escriben código por encargo humano. Tercero: los agentes piden a otros agentes que escriban código mientras los primeros agentes hacen otra cosa.

Cada fase ha multiplicado la velocidad de desarrollo y el volumen de tokens consumidos. La carrera por la automatización agentica ya está generando consolidación en el sector: Anthropic compró Vercept precisamente para incorporar capacidades de control de interfaces dentro del núcleo de Claude Code, anticipando que los loops necesitarán acceso a herramientas externas para ser útiles.

El test real para el loop no está en la conferencia de Meta ni en el pull request de un ingeniero de Anthropic. Está en si una empresa de software mediana puede montarlo, supervisarlo y pagarlo sin que se le vaya de las manos. Ese es el problema que Boris Cherny no resolvió el viernes, aunque lo formuló mejor que nadie.

Mi valoración

Lo que más me convence del concepto de loop es la honestidad implícita: en vez de prometer que un agente resolverá todo en una iteración, el loop admite que mejorar código es un proceso continuo, no un evento. Eso es más parecido a cómo funciona el desarrollo real.

Lo que más me preocupa es la falta de métricas de parada claras. Sin un criterio de éxito bien definido, el loop puede consumir cómputo indefinidamente optimizando hacia proxies que no capturan el objetivo real: el agente mejora la cobertura de tests mientras introduce deuda técnica más profunda.

Lo más significativo es que Cherny es el creador de Claude Code, que ha demostrado ser la herramienta de IA para desarrolladores con mayor adopción en 2026. Cuando alguien con esa plataforma dice que los loops son «igual de importantes que el paso de código a agentes», no es hype: es una hoja de ruta de producto disfrazada de reflexión filosófica.

Mi predicción a 12 meses: los loops serán una feature de pago en los planes enterprise de Claude Code y en la mayoría de plataformas agenticas antes de que acabe 2026. El titular que ya se puede escribir es el mismo que siempre: el progreso en IA es real, el control es el problema pendiente.

Preguntas frecuentes

¿En qué se diferencia un loop agentico de un agente normal?

Un agente normal completa una tarea y se detiene. Un loop corre indefinidamente en segundo plano, revisando y mejorando de forma continua. La diferencia es análoga a la que hay entre un consultor que te entrega un informe y un empleado que revisa y mejora ese informe cada día sin que se lo pidas.

¿Cuánto puede costar un loop agentico en producción?

Depende del modelo, el problema y la cadencia de iteración. En casos documentados de uso intensivo de Claude Code con agentes autónomos corriendo durante semanas, el gasto mensual puede superar los 1.000 euros con facilidad. El umbral de rentabilidad depende del valor que genere el trabajo del agente comparado con el coste de un ingeniero haciendo lo mismo.

¿Hay riesgo de que un loop haga cambios destructivos en el código?

Sí, y es la preocupación principal del sector. Los clasificadores de seguridad de plataformas como Claude Code están diseñados para bloquear acciones destructivas, pero no son infalibles. La recomendación estándar es ejecutar loops en entornos aislados (sandboxes o contenedores) antes de llevarlos a producción.