Sarvam se convierte en el nuevo unicornio de IA de India con 234 millones de dólares liderados por HCLTech

Una semana después del bloqueo de Anthropic Fable 5 que reavivó el debate sobre la dependencia de India en modelos de IA extranjeros, la respuesta local llega en forma de cheque. Sarvam AI, la startup de Bengaluru que construye modelos de lenguaje grandes diseñados específicamente para India, ha cerrado el primer tramo de su Serie B con 234 millones de dólares a una valoración de 1.500 millones de dólares, convirtiéndose en el más reciente unicornio de IA del país. La ronda total apunta a $300 millones; quedan $66 millones pendientes de cierre.

HCLTech, la filial tecnológica del grupo HCL, lidera la ronda con 150 millones de dólares a cambio del 10,46% del capital. Junto a ellos participan Bessemer Venture Partners, Khosla Ventures y Peak XV Partners. C. Vijayakumar, CEO de HCLTech, fue directo sobre la lógica de la inversión: «Al combinar los modelos de IA de Sarvam con la presencia global de HCLTech, estamos creando una plataforma diferenciada de IA completa para empresas y gobiernos, fortaleciendo nuestra capacidad de ofrecer soluciones de IA seguras, escalables y responsables.»

Quiénes son y qué construyen

Sarvam AI fue fundada en 2023 por Vivek Raghavan y Pratyush Kumar, ambos veteranos de AI4Bharat, el proyecto de IA para lenguas indias del IIT de Madras impulsado por Nandan Nilekani. La empresa no construye wrappers sobre GPT ni Gemini: entrena sus propios modelos desde cero en India.

En 2026 publicó en código abierto dos modelos que ya pueden evaluarse: uno de 105.000 millones de parámetros y otro de 30.000 millones, ambos diseñados para lenguas indias y casos de uso locales. También lanzó Sarvam Vision, un modelo para reconocimiento de escritura a mano y documentos en lenguas indias, que ya ha digitalizado más de 35 millones de páginas de formularios de seguros y registros de propiedad.

Las métricas operativas que la empresa publica son sustanciales: más de 2 millones de conversaciones diarias, más de 10 millones de llamadas a la API al día y transcripción de más de 500.000 horas de audio al mes. Su facturación en el año fiscal 2026 (no auditada) fue de Rs 45,1 crore (aproximadamente 5 millones de euros). El revenue es modesto para la valoración, pero refleja que Sarvam está en fase de escala, no de madurez.

La apuesta de HCLTech y el contexto geopolítico

El timing de la inversión es tan relevante como su cuantía. HCLTech tiene contratos con bancos, aseguradoras y gobiernos en todo el mundo. Para esos clientes —especialmente los de sectores regulados— tener un proveedor de IA cuyos modelos no pasan por servidores americanos y no están sujetos a decisiones unilaterales del Commerce Department americano es un argumento de venta real.

La paradoja del episodio Anthropic la resume bien el propio Raghavan: India es el segundo mayor mercado de Anthropic, pero el bloqueo de Fable 5 afectó a todos los nacionales indios sin excepción, incluidos los que trabajaban físicamente en EE.UU. Ninguna empresa india con dependencia total en modelos de frontera americanos puede ignorar ese vector de riesgo.

Los sectores objetivo de Sarvam son exactamente los más sensibles a ese riesgo: banca, seguros, servicios gubernamentales y defensa. En todos ellos, la soberanía del dato y la previsibilidad del suministro son requisitos operativos, no preferencias.

Mi valoración

Lo que más me convence es la apuesta de entrenamiento desde cero. La decisión de construir modelos propios en lugar de ajustar modelos americanos no es solo técnica: es la única forma de crear verdadera independencia. Un modelo ajustado sobre GPT sigue dependiendo de la licencia de OpenAI.

Lo que más me preocupa es la brecha de capacidades. Los modelos de 105.000 millones de parámetros de Sarvam están a varias generaciones de los modelos de frontera americanos. En aplicaciones bancarias o de atención al cliente en lenguas indias, esa brecha es irrelevante. En aplicaciones que requieren razonamiento complejo o capacidades de código de nivel Fable 5, sigue siendo grande.

Lo más estructuralmente significativo es que HCLTech no ha invertido 150 millones en una startup: ha apostado por su propia soberanía tecnológica. Si Sarvam funciona, HCLTech tiene un activo diferencial que ningún competidor de TI puede replicar comprando licencias de AWS o Google Cloud.

Mi predicción: Sarvam tendrá al menos cuatro despliegues gubernamentales significativos en India antes de 2027. El modelo de 30B parámetros se convierte en estándar de facto para aplicaciones de IA en lenguas indias regionales.

Preguntas frecuentes

¿Cuál es la diferencia entre Sarvam y los modelos de IA de OpenAI o Anthropic?

La diferencia principal es el diseño y el control. Los modelos de Sarvam están entrenados desde cero con datos en lenguas indias —el hindi, el tamil, el telugu, el bengalí y otras 18 lenguas constitucionales de India— optimizados para los casos de uso específicos del país. También están diseñados para correr en infraestructura controlada por India, lo que elimina la dependencia regulatoria de jurisdicciones extranjeras. Esto tiene menos relevancia en capacidades de propósito general, pero es determinante en sectores como defensa o gobierno.

¿Está Sarvam disponible para empresas fuera de India?

Técnicamente sí, los modelos están publicados en código abierto y la API está disponible. En la práctica, el posicionamiento estratégico de Sarvam es el mercado indio y la diáspora india. HCLTech tiene presencia global y podría usar los modelos en sus contratos internacionales, pero el diferencial competitivo real de Sarvam está en las lenguas y los contextos indios.

¿Qué es Sarvam Vision y para qué sirve?

Sarvam Vision es un modelo especializado en reconocimiento de texto manuscrito e impreso en lenguas indias, especialmente en documentos de baja calidad como formularios de seguros, registros de tierras y expedientes médicos. El reto es que los caracteres de muchas lenguas indias son complejos y las fuentes tipográficas son muy variables. A diferencia del OCR occidental, que funciona bien con textos en caracteres latinos, el reconocimiento de texto indio en documentos históricos o de baja calidad es un problema abierto que Sarvam ha abordado con un modelo propio.