Meituan entrena el primer modelo de más de un billón de parámetros íntegramente con chips chinos —y abre su código a todo el mundo

Publicado el

Meituan entrena el primer modelo de más de un billón de parámetros íntegramente con chips chinos —y abre su código a todo el mundo

Meituan, el gigante chino de reparto a domicilio conocido como el «DoorDash chino», ha presentado LongCat-2.0, un modelo de lenguaje de 1,6 billones de parámetros que la compañía describe como el primero de su escala entrenado de principio a fin —preentrenamiento e inferencia— exclusivamente sobre un clúster de 50.000 chips de fabricación nacional china. El modelo se ha lanzado en código abierto, replicando la estrategia que catapultó a DeepSeek a la atención mundial a principios de 2025.

Lo reportan Reuters, South China Morning Post y The Edge Malaysia este 30 de junio. Meituan afirma que el rendimiento de LongCat-2.0 es comparable al de Gemini 3.1 Pro de Google, lanzado en febrero, y que el modelo iguala o supera a varios sistemas propietarios líderes —incluyendo Gemini, GPT-5.5 y Claude Opus— en ciertos benchmarks de programación y tareas agénticas.

Por qué entrenar con chips chinos es la noticia, no el modelo en sí

La cifra de parámetros y los benchmarks de rendimiento son secundarios frente al dato que realmente importa: hasta ahora, la inferencia —el proceso por el que un modelo ya entrenado responde a preguntas de usuarios— se podía ejecutar razonablemente bien en chips chinos como los Ascend de Huawei. Pero el entrenamiento, el proceso mucho más intensivo en cómputo donde un modelo aprende desde cero a partir de billones de tokens de datos, seguía dependiendo casi siempre de GPU de NVIDIA, incluso para los laboratorios chinos más avanzados.

DeepSeek-V4 Pro, el mayor modelo de pesos abiertos del mundo hasta ahora con 1,6 billones de parámetros, ya corría su inferencia en chips Huawei Ascend 950, pero su entrenamiento siguió dependiendo de GPU NVIDIA. LongCat-2.0 afirma haber roto esa dependencia por completo: tanto el preentrenamiento como la inferencia se ejecutaron sobre el mismo clúster de 50.000 chips chinos, basados en arquitecturas ASIC (circuitos de aplicación específica) probablemente vinculadas a la tecnología de Huawei, incluyendo su Biblioteca de Comunicación Colectiva y los SuperPods Atlas-950, aunque Meituan no ha confirmado públicamente al fabricante exacto.

Este hito llega después de que el propio DeepSeek experimentara un fracaso documentado en 2025 al intentar migrar su infraestructura de entrenamiento de NVIDIA a chips Ascend de Huawei — un fallo grave que provocó meses de retraso en su modelo R2 y que sirvió como recordatorio de lo difícil que es replicar a escala la eficiencia de CUDA con software y hardware chinos. Que Meituan afirme haber superado ese obstáculo, con un modelo de tamaño comparable al de DeepSeek V4 Pro, es la prueba de concepto más sólida hasta la fecha de que la apuesta de China por la independencia de hardware empieza a dar resultados verificables.

Las especificaciones técnicas y el contexto comercial

LongCat-2.0 ofrece una ventana de contexto de 1 millón de tokens, suficiente para procesar documentos extremadamente largos de una sola vez. El equipo de LongCat, fundado en 2023, es un actor relativamente tardío en el ecosistema de IA chino, donde compite con DeepSeek y Doubao de ByteDance — y lanzó su primer modelo apenas a finales del año pasado.

Meituan no ha detallado públicamente cómo integrará LongCat-2.0 en sus negocios existentes, aunque versiones anteriores del modelo ya impulsan asistentes dentro de su app que recomiendan restaurantes y hoteles, y completan tareas como pedir comida o reservar habitaciones — parte de una tendencia de «comercio agéntico» que su rival Alibaba también está persiguiendo de forma activa. En medio de un sentimiento de consumo débil y márgenes cada vez más ajustados en su negocio principal de reparto, Meituan también podría estar buscando diversificar sus fuentes de ingresos a través de licencias o servicios de IA empresarial.

El dilema estratégico entre apostar por GPU generalistas o por ASIC diseñados a medida ha dividido al sector tecnológico chino durante meses — los ASIC pueden fabricarse con los procesos de 7 nanómetros disponibles en SMIC, mientras que una GPU competitiva como las de NVIDIA requiere procesos de 4 nanómetros o inferiores, a los que China no tiene acceso pleno por las restricciones de exportación de equipos de litografía. LongCat-2.0, construido sobre ASIC en lugar de GPU generalistas, es la apuesta más visible hasta ahora por el lado ASIC de ese dilema, justo cuando Huawei sigue prometiendo cerrar la brecha tecnológica con TSMC para 2031 mediante enfoques de diseño alternativos como su «Ley Tau».

Mi valoración

He seguido la carrera de semiconductores entre EE.UU. y China desde las primeras restricciones de exportación de 2022, y LongCat-2.0 representa un punto de inflexión narrativo más que técnico. Las exportaciones de chips avanzados que Washington ha restringido a China no han frenado la inversión en IA china — más bien la han acelerado, con el país generando un nuevo unicornio de IA cada cinco días según análisis recientes de HSBC, y LongCat-2.0 es la prueba técnica más concreta de que esa inversión está produciendo resultados de infraestructura, no solo de modelos.

Lo que más me preocupa es la verificación independiente. Hasta la fecha de esta publicación, plataformas de benchmarking independientes como Artificial Analysis no han publicado evaluaciones comparativas de LongCat-2.0, lo que significa que las afirmaciones de rendimiento equiparable a Gemini 3.1 Pro provienen exclusivamente de la propia Meituan.

Mi predicción: si las afirmaciones de Meituan se sostienen bajo escrutinio independiente en las próximas semanas, LongCat-2.0 obligará a Washington a reconsiderar la premisa central de su política de control de exportaciones — que cortar el acceso a las GPU más avanzadas frenaría estructuralmente el entrenamiento de modelos de frontera en China. Esa premisa, hasta ahora, parecía sostenerse; LongCat-2.0 es el primer dato duro que la pone en duda real.

Preguntas frecuentes

¿En qué se diferencia LongCat-2.0 de DeepSeek V4 Pro si ambos tienen 1,6 billones de parámetros?

La diferencia clave no está en el tamaño sino en la infraestructura de entrenamiento. DeepSeek V4 Pro ejecutaba su inferencia en chips chinos Huawei Ascend, pero su preentrenamiento —la fase más intensiva en cómputo— seguía dependiendo de GPU NVIDIA. Meituan afirma que LongCat-2.0 es el primer modelo de esa escala con ambas fases, preentrenamiento e inferencia, completadas íntegramente sobre hardware de fabricación china, sin ninguna dependencia de GPU NVIDIA en ningún punto del proceso.

¿Por qué Meituan, una empresa de reparto de comida, está construyendo modelos de IA de frontera?

Meituan ha estado desarrollando capacidades de IA para potenciar asistentes dentro de su propia app —recomendaciones de restaurantes, reservas de hotel, pedidos automatizados— como parte de una tendencia de «comercio agéntico» que también persigue su rival Alibaba. Ante una desaceleración del consumo y márgenes cada vez más ajustados en su negocio principal, lanzar LongCat-2.0 en código abierto también puede funcionar como estrategia de diversificación de ingresos y de posicionamiento tecnológico frente a competidores como Alibaba y ByteDance.