Un nuevo capítulo en la inteligencia artificial: China afina un modelo de mil millones de parámetros con computación cuántica

Publicado el

Ilustración surrealista y minimalista de una computadora cuántica china con chip de 72 cúbits ajustando un modelo de inteligencia artificial. Representación conceptual con cerebro humano, dragón de datos y elementos cuánticos. Fondo blanco, estilo limpio y simbólico.

La inteligencia artificial y la computación cuántica suelen sonar como conceptos del futuro lejano, pero en China ya están trabajando en una intersección que hasta hace poco parecía ciencia ficción. Investigadores del Centro de Ingeniería de Computación Cuántica de Anhui lograron ajustar un modelo de inteligencia artificial de mil millones de parámetros utilizando su ordenador cuántico, Origin Wukong, abriendo una nueva puerta para resolver uno de los mayores retos tecnológicos de la actualidad: el límite de la capacidad computacional.

¿Qué es Origin Wukong y por qué importa?

Para entender la magnitud del logro, primero hay que conocer a Origin Wukong, un ordenador cuántico que funciona con un chip superconductivo de 72 cúbits. Este dispositivo, desarrollado por científicos chinos, debe su nombre a Sun Wukong, el Rey Mono de la mitología china, famoso por sus 72 transformaciones. El nombre no es casual: como su homónimo mítico, este sistema se adapta a distintos tipos de tareas y sectores, desde las finanzas hasta la medicina.

Desde su lanzamiento en enero de 2024, Origin Wukong ha ejecutado más de 350.000 tareas y ha sido utilizado por usuarios de 139 países a través de plataformas en línea. Su capacidad de realizar tareas simultáneamente en distintos hilos de cálculo ha convertido este equipo en un laboratorio ideal para explorar los límites de la inteligencia artificial cuántica.

¿Qué se logró exactamente?

El equipo utilizó Origin Wukong para «afinar» un modelo de lenguaje de gran tamaño (LLM). A diferencia del entrenamiento inicial, que construye el modelo desde cero, el fine-tuning adapta un modelo ya existente a contextos específicos —por ejemplo, convertir un modelo general en un chatbot especializado en salud mental—.

El experimento empleó un conjunto de datos de salud mental, y los resultados fueron sorprendentes:

  • 15 % de mejora en la calidad del entrenamiento.
  • Aumento de la precisión matemática del 68 % al 82 %.
  • Incluso al reducir el tamaño del modelo en un 76 %, el rendimiento mejoró un 8,4 %.

Esto indica que los ordenadores cuánticos no solo pueden acelerar el procesamiento, sino también hacerlo de forma más eficiente, ayudando a superar el llamado “estrés de capacidad de cómputo” que aqueja a empresas que trabajan con modelos cada vez más grandes.

¿Por qué es tan difícil ajustar modelos de esta magnitud?

Imagina tratar de entrenar a un elefante para que baile ballet… en una cancha de baloncesto. Eso es lo que se siente para muchos equipos de investigación cuando deben refinar modelos gigantes sin acceso a infraestructuras computacionales masivas. Cada parámetro en estos modelos representa una conexión, una regla o una relación que debe ser calibrada para responder correctamente a preguntas complejas o detectar matices del lenguaje.

Los modelos de mil millones de parámetros requieren enormes cantidades de energía, tiempo y almacenamiento, lo que limita su accesibilidad a unos pocos gigantes tecnológicos. Ahí es donde entra en juego la computación cuántica.

¿Qué hace especial a la computación cuántica en este contexto?

La computación cuántica no reemplaza a la tradicional, pero puede complementarla con ventajas únicas. Gracias a los cúbits —que pueden representar múltiples estados al mismo tiempo— un ordenador cuántico puede procesar de forma paralela tareas que una computadora clásica abordaría una por una.

Como lo explicó Dou Menghan, vicepresidente de Origin Quantum, es como si se le colocara un motor cuántico a un coche clásico: no se trata de reemplazar el coche, sino de potenciarlo hasta límites insospechados.

Esta sinergia permite lo que antes parecía imposible: hacer más con menos. Menos parámetros, menos energía, menos tiempo… y mejores resultados.

Implicaciones para el futuro de la IA y la computación

El experimento demuestra que la optimización de modelos mediante computación cuántica es viable, útil y medible, lo que sienta las bases para una nueva generación de modelos de IA más accesibles, compactos y personalizados.

A medida que crece la demanda de modelos especializados —por ejemplo, asistentes legales, traductores médicos o motores de recomendación culturales— se necesitarán soluciones que no dependan exclusivamente de supercomputadoras convencionales.

En un mundo donde la eficiencia computacional es tan valiosa como la potencia bruta, la computación cuántica aparece como un aliado inesperado, capaz de democratizar el acceso a inteligencia artificial avanzada.

¿Qué dicen los expertos?

Chen Zhaojun, del Instituto de Inteligencia Artificial del Centro Nacional de Ciencia Integral de Hefei, destacó que este avance marca un gran paso para la computación cuántica aplicada. Aunque países como Estados Unidos, Canadá y las naciones europeas también desarrollan tecnologías similares, este experimento ubica a China a la vanguardia en la combinación práctica de IA y hardware cuántico.

El logro también abre el debate sobre el diseño de futuros algoritmos híbridos, que aprovechen lo mejor de ambos mundos: la robustez de la computación clásica y la versatilidad de la cuántica.

¿Qué significa para empresas e industrias?

Para sectores como el financiero, la medicina o la ingeniería, este tipo de IA ajustada con computación cuántica puede ofrecer ventajas prácticas inmediatas:

  • Reducción de costos en entrenamiento de modelos.
  • Mayor precisión en tareas sensibles como diagnóstico médico o predicciones financieras.
  • Menor necesidad de infraestructura, permitiendo que más actores participen en la innovación.

Si antes solo los gigantes tecnológicos podían permitirse entrenar modelos de última generación, ahora se abre la puerta para que empresas medianas o universidades exploren el uso de LLMs adaptados a sus necesidades concretas.