Anthropic ha presentado una actualización clave para su plataforma Claude Developer Platform que promete facilitar el desarrollo de agentes de inteligencia artificial más capaces, eficientes y escalables. Esta evolución se basa en tres funciones experimentales: Tool Search Tool, Programmatic Tool Calling y Tool Use Examples, diseñadas para optimizar cómo los modelos interactúan con bibliotecas extensas de herramientas y ejecutan tareas complejas.
Acceso dinámico a herramientas con Tool Search Tool
Uno de los retos más comunes en la creación de agentes inteligentes es el manejo del contexto. Cuando un modelo necesita trabajar con decenas de herramientas, como sucede en entornos MCP (Multi-Cloud Platform), las definiciones de cada herramienta pueden consumir decenas de miles de tokens incluso antes de iniciar la tarea real. Claude solía cargar todas las definiciones desde el principio, lo que limitaba drásticamente el espacio disponible para la conversación o el análisis.
La solución llega con Tool Search Tool, una herramienta que permite a Claude buscar y descubrir herramientas cuando realmente las necesita. En lugar de cargar definiciones innecesarias, se cargan solo aquellas que el modelo detecta como relevantes para el contexto actual. Por ejemplo, si se necesita interactuar únicamente con GitHub, solo se cargarán herramientas como createPullRequest o listIssues, dejando fuera otras de Slack o Jira.
Este enfoque ahorra hasta el 85% del espacio de contexto, según pruebas internas de Anthropic. Modelos como Opus 4.5 mejoraron su precisión en tareas de selección de herramientas, pasando de un 79,5% a un 88,1% al usar Tool Search Tool.
Ejecución orquestada con Programmatic Tool Calling
Cuando un agente necesita consultar múltiples fuentes, combinar datos y ejecutar decisiones, el modelo puede verse sobrecargado si cada llamada a herramientas pasa por su contexto. El modelo no solo tiene que inferir qué hacer, sino también sintetizar manualmente todos los resultados, lo que consume tiempo y tokens de forma ineficiente.
Programmatic Tool Calling cambia este paradigma al permitir que Claude orqueste herramientas mediante código. En vez de hacer llamadas secuenciales en lenguaje natural, Claude escribe código en Python que gestiona bucles, condicionales, y transformaciones de datos. Este código se ejecuta en un entorno controlado, devolviendo al modelo únicamente el resultado final.
Un ejemplo práctico es el análisis de gastos por equipo. En lugar de cargar miles de registros de gastos al contexto, Claude ejecuta un script que suma los montos, compara con presupuestos y retorna solo los casos relevantes. Esta técnica reduce el consumo de tokens en un 37% y permite ejecutar flujos de trabajo más complejos con mayor precisión.
Claude solo ve el resultado procesado: por ejemplo, los tres empleados que superaron su presupuesto. El resto de la información —cientos de líneas de datos— nunca entra en su memoria activa.
Mejor comprensión gracias a Tool Use Examples
Las definiciones de herramientas en formato JSON Schema explican qué parámetros son requeridos y cómo debe estructurarse una llamada, pero no siempre indican cómo usarlas correctamente. Muchos errores surgen de malentendidos sobre el formato de campos, relaciones entre parámetros o convenciones internas del sistema.
Tool Use Examples aporta una solución clara: permitir que los desarrolladores proporcionen ejemplos de uso reales dentro de las definiciones de herramientas. Esto ayuda a Claude a entender patrones de uso, valores típicos y estructuras anidadas complejas.
Por ejemplo, en una API para crear tickets de soporte, un ejemplo puede mostrar que para errores críticos se suele incluir contacto completo y una escalada de prioridad, mientras que para solicitudes internas basta con un título. Estos ejemplos enseñan al modelo mucho más que cualquier validación estructural.
Anthropic observó mejoras significativas en pruebas internas: la precisión en el manejo de parámetros complejos subió del 72% al 90% al incorporar ejemplos de uso.
Cómo se integran estas funciones en el flujo de trabajo
Estas tres novedades están diseñadas para complementarse entre sí. Tool Search Tool actúa como un filtro inteligente que solo introduce en el contexto lo que es relevante. Programmatic Tool Calling permite manejar esos datos con lógica personalizada y sin saturar al modelo. Y Tool Use Examples garantiza que cada herramienta se utilice de forma coherente y alineada con las expectativas del sistema.
Los desarrolladores pueden activar estas funciones marcando herramientas como diferibles (defer_loading: true), permitiendo su uso desde código (allowed_callers), y agregando ejemplos realistas en input_examples. El entorno de ejecución de código (code_execution) actúa como intermediario entre las llamadas a herramientas y los resultados finales, evitando que datos intermedios innecesarios contaminen la memoria de Claude.
Cuándo aplicar cada función
Cada uno de estos avances tiene casos ideales de uso:
- Usa Tool Search Tool si tienes más de 10 herramientas, con definiciones que consumen muchos tokens, o si has notado errores por selección incorrecta.
- Programmatic Tool Calling es especialmente útil cuando trabajas con datos grandes, necesitas hacer cálculos o transformaciones complejas, o quieres ejecutar tareas en paralelo.
- Tool Use Examples aporta valor cuando tus herramientas tienen parámetros opcionales, estructuras anidadas o convenciones de formato que no se pueden deducir fácilmente desde el esquema.
Cuando se usan en conjunto, estas capacidades permiten construir agentes que toman decisiones más precisas, usan menos recursos y pueden escalar a entornos empresariales con cientos de herramientas conectadas.
Hacia una nueva era de agentes cognitivos
Con estas funciones, Claude da un paso importante hacia la ejecución inteligente de flujos de trabajo complejos, no solo reaccionando a las instrucciones de los usuarios, sino gestionando herramientas como lo haría un operador humano experimentado. Esto allana el camino para asistentes capaces de coordinar múltiples sistemas, extraer insights de grandes volúmenes de datos y ejecutar tareas críticas con eficiencia y fiabilidad.
El potencial va más allá del desarrollo de software: estas capacidades podrían aplicarse a la atención al cliente, análisis financiero, automatización de operaciones y cualquier otro ámbito donde la integración con múltiples servicios y el procesamiento eficiente de información sean clave.
