El caso Mistral y por qué debería importarte que se filtre un nuevo modelo de IA

Publicado el

Mistral

En los últimos días, la comunidad de inteligencia artificial de código abierto ha sido testigo de un evento que, aunque a primera vista puede parecer solo otro capítulo en el vertiginoso mundo de la tecnología, tiene implicaciones profundas para el futuro del desarrollo y la utilización de herramientas de IA. La filtración de un nuevo modelo de IA por parte de un empleado de un cliente de acceso temprano de la compañía parisina Mistral ha sacudido los cimientos de esta comunidad, ofreciendo una oportunidad única para reflexionar sobre la naturaleza del progreso tecnológico y su democratización.

Todo comenzó cuando un usuario bajo el pseudónimo «Miqu Dev» compartió en HuggingFace, una plataforma líder en el intercambio de modelos y códigos de IA de código abierto, un conjunto de archivos que conformaban un modelo de lenguaje de gran escala, apodado «miqu-1-70b». Este modelo no solo compartía el formato de interacción de Mistral, conocido por su anterior modelo de alto rendimiento Mixtral 8x7b, sino que también mostraba un rendimiento que rozaba el de GPT-4, el líder actual en este campo desarrollado por OpenAI.

La noticia de este descubrimiento se esparció rápidamente, suscitando un torbellino de especulaciones y análisis. Expertos en aprendizaje automático y entusiastas de la tecnología comenzaron a teorizar sobre la posibilidad de que «Miqu» fuera una versión cuantizada de un modelo de Mistral, una técnica que permite a los modelos de IA ejecutarse en hardware menos potente simplificando algunos de sus procesos internos. La idea de que Mistral estuviera detrás de esta filtración, intencionada o no, planteó preguntas sobre las estrategias de lanzamiento de nuevos productos tecnológicos y la gestión de la propiedad intelectual.

La confirmación llegó directamente del CEO de Mistral, Arthur Mensch, quien a través de una publicación en X (anteriormente conocido como Twitter) aclaró que se trataba de una versión cuantizada y marcada con agua de un modelo antiguo, distribuido de manera abierta para trabajar con algunos clientes seleccionados. Este modelo en cuestión, aunque antiguo, representaba una etapa inicial en el desarrollo de lo que prometía ser una tecnología capaz de igualar, e incluso superar, a GPT-4.

¿Por qué es importante?

Esta filtración pone de relieve la velocidad a la que avanza la tecnología de IA y cómo el código abierto juega un papel crucial en democratizar el acceso a herramientas de vanguardia. La posibilidad de que exista un modelo de IA de alta calidad, libre de costos y restricciones, es algo que podría cambiar las reglas del juego para empresas, desarrolladores y usuarios finales. La competencia se intensifica, no solo para OpenAI sino para todos los actores del mercado, que ahora deben reconsiderar sus estrategias para mantenerse relevantes.

Este episodio también celebra el poder de la comunidad de código abierto. A través de plataformas como HuggingFace, se fomenta la colaboración y la innovación rápida, permitiendo que el conocimiento y los recursos sean más accesibles. La capacidad de compartir desarrollos y trabajar conjuntamente en mejoras reduce las barreras para la entrada y acelera el progreso en campos tan complejos y cambiantes como la IA.

Google ha movido ficha, OpenAI con Microsoft sigue liderando, Claude y Pi están en el ranking, pero Mistral, este nuevo personaje, puede llegar muy lejos con la colaboración de la comunidad que le apoya.