KPMG retiró un informe sobre el uso de IA en empresas porque la IA se había inventado lo que escribió en él

La firma de consultoría KPMG eliminó de sus plataformas digitales el informe «Total Experience: Redefining Excellence in the Age of Agentic AI«, publicado en octubre de 2025, después de que varias organizaciones citadas en el documento como casos de uso de IA declararan que las afirmaciones sobre ellas eran falsas. El detonante fue una investigación del grupo GPTZero —desarrolladores de herramientas de detección de IA— que identificó múltiples alucinaciones en el texto usando su sistema Hallucination Check. Fue el Financial Times quien publicó los hallazgos. Lo recoge hoy TechCrunch.

Las organizaciones que negaron las afirmaciones del informe incluyen UBS, el National Health Service del Reino Unido, los Ferrocarriles Federales Suizos y Transport for London. Según el FT, el informe afirmaba, por ejemplo, que UBS «integra agentes de IA en asesoría de inversión, gestión de riesgos y control de cumplimiento» a través de «una plataforma componible codesarrollada con Microsoft». UBS dijo que eso no es cierto. GPTZero concluyó que las afirmaciones no eran errores de investigación sino alucinaciones: el modelo de IA que ayudó a redactar el informe se inventó casos de uso que suenan plausibles pero nunca ocurrieron.

El resumen de la situación, que va directo al punto: KPMG usó IA para escribir un informe sobre el uso de IA, y la IA fabricó la evidencia que necesitaba para sostener el argumento del informe.

Por qué este caso importa más que otros errores similares

No es el primer informe corporativo con alucinaciones de IA que se retira. El mes anterior a este caso, EY retiró un informe sobre programas de fidelización que incluía notas al pie falsas y afirmaciones generadas por IA. GPTZero ha documentado casos similares en publicaciones académicas en conferencias de machine learning como ICLR y NeurIPS, en informes gubernamentales, y ya en dos de las cuatro grandes consultoras.

Lo que hace el caso de KPMG especialmente relevante es el nivel de ironía estructural. El informe no era sobre un tema cualquiera; era sobre IA agentiva —sistemas de IA que toman decisiones autónomas y ejecutan flujos de trabajo sin supervisión humana. El informe argumentaba precisamente que las organizaciones que usan IA agentiva obtienen ventajas competitivas. Y KPMG lo redactó usando IA sin supervisión humana suficiente para verificar que las afirmaciones sobre sus sujetos fueran verdaderas.

Las firmas de consultoría llevan años advirtiendo a sus clientes sobre el riesgo de las alucinaciones de IA en procesos críticos. Su mensaje estándar incluye siempre la necesidad de supervisión humana y validación de fuentes. La propia KPMG tiene una guía interna sobre uso responsable de IA que, según el comunicado posterior al retiro, sus empleados «debían seguir». Esa guía exige revisión humana y verificación de fuentes independientes. No se siguió.

El proceso que falló y sus consecuencias

GPTZero describe el proceso que permitió el error: el sistema de IA, al redactar secciones sobre casos de uso empresarial, necesitaba ejemplos concretos. En lugar de citar fuentes verificadas, generó afirmaciones que sonaban creíbles —grandes organizaciones con programas de IA sofisticados— porque ese tipo de afirmaciones son estadísticamente probables en el universo de texto sobre el que fue entrenado. El modelo no «mintió» deliberadamente; hizo exactamente lo que los modelos de lenguaje hacen cuando no tienen información verificada: generó la respuesta más plausible dado el contexto.

El problema fue que nadie en el proceso editorial verificó las afirmaciones con las organizaciones citadas antes de publicar. En periodismo, ese paso es obligatorio; en una consultoría, aparentemente no.

Dos KPMG hablarán de este caso durante años. La primera es el KPMG que advierte a clientes sobre riesgos de IA. La segunda es el KPMG que publicó un informe fabricado por IA sobre los beneficios de la IA sin revisar si lo que decía era cierto.

Mi valoración

Lo que más me convence es la decisión de retirar el informe. Muchas organizaciones en situaciones similares buscan minimizar el daño sin reconocer el fallo. KPMG lo retiró y abrió una investigación interna. Es el comportamiento correcto aunque haya llegado después de que el FT lo publicara.

Lo que más me preocupa no es el error de KPMG en sí — es el incentivo estructural que lo produce. Las consultoras están bajo presión para generar volumen de contenido de thought leadership y simultáneamente están adoptando IA para aumentar su productividad. Ese cruce produce la condición perfecta para que el error de KPMG se repita en otras firmas. EY ya lo sufrió el mes anterior.

Lo más estructuralmente significativo es la implicación para los informes que usan casos de uso de terceros sin verificación directa. Cualquier documento de consultoría, informe sectorial o estudio de mercado que haya sido «acelerado» con IA generativa y no haya pasado por verificación directa con las organizaciones citadas tiene ahora un vector de riesgo conocido y documentado.

Mi predicción: en 12 meses, las cuatro grandes consultoras tendrán procesos obligatorios de verificación con terceros para cualquier informe que use IA en la redacción. Ese proceso existirá no porque hayan decidido ser más rigurosas, sino porque el riesgo reputacional de otro caso KPMG es demasiado alto para no tenerlo.

Preguntas frecuentes

¿Las alucinaciones de IA son evitables en documentos de consultoría?

Las alucinaciones son un límite matemático de los modelos de lenguaje actuales, no un fallo de implementación. No desaparecen con mejores modelos: se reducen, pero persisten especialmente en afirmaciones factuales específicas sobre organizaciones o datos verificables. La forma de evitar que lleguen a un documento publicado no es esperar a que el modelo no alucine, sino verificar independientemente cada afirmación factual antes de publicar. Eso requiere tiempo humano.

¿Por qué GPTZero detectó las alucinaciones antes que el equipo editorial de KPMG?

GPTZero tiene herramientas de detección específicamente entrenadas para identificar patrones de alucinaciones en texto generado por IA, incluyendo la técnica de verificar cada cita contra su fuente original. Un equipo editorial humano que confía en que el modelo de IA ya ha hecho la investigación puede no pensar en verificar cada afirmación si el texto suena internamente coherente. La alucinación de IA bien ejecutada pasa el test de «¿suena esto plausible?» con nota; falla el test de «¿es esto verificable?».

¿Puede KPMG ser demandada por las organizaciones cuyo uso de IA fue fabricado?

Posiblemente, dependiendo de cómo esas organizaciones prueben el daño causado por las afirmaciones falsas. Si UBS puede demostrar que el informe causó confusión entre clientes o reguladores sobre sus capacidades o compromisos de IA, hay base para una reclamación. Más probable es que las organizaciones exijan una disculpa formal y corrección del registro, sin llegar a litigio, porque el proceso judicial es costoso y la cobertura mediática del retiro ya ha establecido el registro correcto.