En el mundo empresarial hay una frase que se repite tanto que ha perdido todo su filo: «la IA va a mejorar vuestra productividad.» Lo dicen Nvidia, Microsoft, Anthropic, OpenAI. Lo dicen los CIOs en las presentaciones a los consejos de administración. Y lo creyó Uber, que en 2025 incentivó a sus empleados a adoptar herramientas de IA a través de un sistema interno de clasificación por equipos según el total de tokens consumidos. El resultado de todo ese gasto: el 26 de mayo de 2026, el COO de Uber, Andrew Macdonald, admite en entrevista que no puede trazar una línea directa entre lo que se ha gastado en IA y lo que se ha producido para los usuarios. Lo publica Gizmodo este mismo día.
La declaración importa más de lo que parece. No viene de un escéptico de la IA ni de un analista externo. Viene del segundo ejecutivo de la empresa que agotó su presupuesto anual de Claude Code y Cursor en los primeros cuatro meses de 2026.
Los números de Uber en IA: impresionantes en adopción, silenciosos en resultados
Midiendo por adopción, Uber es un éxito de la IA empresarial. El 95% de sus ingenieros usa herramientas de IA mensualmente. El 70% del código comprometido es generado con asistencia de IA. El CEO Dara Khosrowshahi añadió en la última llamada de resultados que aproximadamente el 10% del código comprometido lo construyen agentes autónomos sin intervención humana directa, y que el uso de IA se extiende más allá de ingeniería: al departamento legal, al marketing.
El CTO Praveen Neppalli Naga reveló en abril, en una entrevista con The Information, que Uber había superado su presupuesto completo de Claude Code y Cursor para el año entero en los primeros cuatro meses de 2026. Poco después, la empresa anunció en su llamada de resultados que elevaría aún más ese gasto en IA y ralentizaría las contrataciones para compensarlo.
Pero entonces llegó la entrevista de Macdonald. La pregunta de fondo —¿cuántos proyectos que antes estaban desestimados han salido adelante gracias a las ganancias de productividad que produce el hecho de que el 25% de los commits de código vayan por Claude Code?— no tiene respuesta clara. El COO lo dijo con la honestidad que pocas veces se escucha en conferencias tecnológicas: «Ese vínculo no está ahí todavía.»
La frase completa es más reveladora: «Puede que implícitamente se estén produciendo más funcionalidades, pero es muy difícil trazar una línea entre una de esas estadísticas y ‘vale, ahora estamos produciendo un 25% más de funcionalidades útiles para el consumidor.'»
Y añadió la consecuencia práctica: «Si no puedes trazar una línea directa hacia cuántas funcionalidades útiles estás enviando a tus usuarios, ese trade-off se vuelve más difícil de justificar.»
La paradoja de los tokens y el problema de la medición
Lo que Uber describe es la misma paradoja que está apareciendo en toda la industria de software empresarial en 2026: los costes de la IA son medibles y crecientes; los beneficios de la IA son difusos y difíciles de atribuir. Los tokens se compran y se cobran. La productividad se declara pero no se verifica.
Parte del problema es el sistema de incentivos. Cuando Uber instauró su leaderboard interno ranking a los equipos por consumo total de herramientas de IA, estaba midiendo la adopción, no el resultado. Y optimizó exactamente para lo que medía: más tokens consumidos, no necesariamente más valor entregado. El CEO Jensen Huang de Nvidia argumentó a principios de año que un ingeniero de software que gana 500.000 dólares debería consumir «al menos 250.000 dólares en tokens» al año. Esa lógica mide el gasto en IA como porcentaje del coste del empleado, no como retorno.
La evidencia académica disponible sobre si la IA mejora realmente la productividad ya apuntaba a resultados mixtos: mejoras reales en tareas individuales concretas, pero mucho más difusos cuando se escala al nivel de empresa o de economía. El caso Uber confirma empíricamente lo que la economía sospechaba: la productividad de un ingeniero no es igual a la productividad de un equipo, que a su vez no es igual a las funcionalidades útiles que recibe el usuario final.
Los copilots de IA para el trabajo —Claude Code, GitHub Copilot, Gemini Code Assist— son genuinamente buenos acelerando tareas individuales: completar código repetitivo, generar tests, documentar funciones. Donde la cadena se rompe es en la atribución: un sprint que antes tardaba dos semanas tarda una y media con IA, ¿pero el sprint producía algo que el usuario necesitaba antes de que existiera la IA? Ese contrafactual es casi imposible de medir.
Mi valoración
Después de años cubriendo promesas tecnológicas con ciclos de expectativas-decepción-adaptación, lo que dice Macdonald me parece el inicio de la fase realista del ciclo de la IA empresarial. No es que la IA no sirva. Es que la relación entre gasto en IA y valor entregado al usuario no es lineal, no es inmediata y no es fácil de medir con las métricas que las empresas tienen instaladas.
Lo que más me convence del análisis es que Uber no es una empresa tecnológicamente tímida. Si ellos, con el 95% de adopción y 70% del código generado con IA, no pueden demostrar el ROI, el problema no es de adopción. Es de métrica y de madurez del mercado.
Lo que más me preocupa es el efecto pendiente: si las empresas que más han invertido en IA empiezan a cuestionar el retorno, el siguiente paso lógico es renegociar contratos, reducir licencias y exigir más datos de impacto a los proveedores. Para Anthropic, OpenAI y GitHub, eso puede ser incómodo.
El impacto de la IA en el mercado laboral sigue siendo una de las grandes preguntas sin resolver. Uber ralentiza contrataciones para pagar la IA. Si la IA no produce el ROI esperado, habrá ralentizado la contratación y no habrá obtenido las ganancias de productividad que justificaban ese recorte. Esa dinámica, multiplicada por miles de empresas, tiene consecuencias laborales que ningún benchmark de tokens puede capturar.
Preguntas frecuentes
¿Qué es Claude Code y por qué lo usa Uber?
Claude Code es la herramienta de programación asistida por IA de Anthropic para uso en terminal. En el contexto de Uber, es una de las principales herramientas de asistencia a los ingenieros: según el propio CEO de Uber, el 25% de los commits de código se realizan a través de Claude Code. La empresa agotó su presupuesto anual completo de esta herramienta en los primeros cuatro meses de 2026.
¿Qué significa que el 70% del código de Uber sea «AI-generated»?
Significa que el 70% del código que los ingenieros de Uber envían a producción ha sido generado o co-generado con herramientas de IA como Claude Code o Cursor. Eso no significa que no haya revisión humana; en la mayoría de los casos los ingenieros revisan y modifican el código que la IA propone. Pero la IA ha sido la que generó el borrador inicial.
¿Cuál es el problema de medir la productividad en IA?
El problema es la diferencia entre métricas de adopción (tokens consumidos, porcentaje de código generado) y métricas de valor (funcionalidades útiles entregadas, tiempo hasta mercado, satisfacción del usuario). Las primeras son fáciles de medir; las segundas requieren definir contrafactuales —¿qué habría pasado sin IA?— que son inherentemente difíciles de construir. El caso Uber ilustra que una empresa puede tener altísimas métricas de adopción y aun así no poder demostrar el valor producido.
