Sesame revoluciona la inteligencia artificial con la liberación de su modelo base CSM-1B

Publicado el

Figura futurista con sonido generado por IA y código flotante, representando el modelo CSM-1B de Sesame.

La empresa Sesame, conocida por su asistente virtual Maya, ha dado un paso audaz al hacer público su modelo base de inteligencia artificial. Este modelo, denominado CSM-1B, es una red neuronal de 1.000 millones de parámetros, optimizada para generar audio realista a partir de texto y otras entradas de voz.

Un modelo de código abierto con potencial comercial

Sesame ha publicado CSM-1B bajo la licencia Apache 2.0, lo que significa que puede ser utilizado con fines comerciales sin demasiadas restricciones. Este movimiento permite que empresas y desarrolladores accedan a una tecnología avanzada para crear nuevas aplicaciones basadas en inteligencia artificial.

El modelo emplea una tecnología conocida como RVQ (Residual Vector Quantization) para codificar audio en pequeños fragmentos llamados «códigos». Este enfoque es similar al que utilizan otras grandes tecnologías como SoundStream de Google y Encodec de Meta, lo que subraya su solidez y versatilidad.

La tecnología detrás de CSM-1B

CSM-1B utiliza una variante de Llama, un modelo desarrollado por Meta, como su columna vertebral, a la que se le ha integrado un decodificador de audio especializado. Maya, el asistente de voz que ha causado sensación en redes sociales, es una versión afinada de este modelo, lo que le permite lograr una naturalidad impresionante en sus respuestas.

El equipo de Sesame ha aclarado que el modelo publicado es una versión base y que no ha sido entrenado específicamente en una sola voz. Sin embargo, la capacidad de CSM-1B para generar distintos tonos y estilos lo hace una opción atractiva para una amplia gama de aplicaciones, desde asistentes virtuales hasta narraciones automáticas.

Falta de salvaguardas: una preocupación creciente

A pesar de sus avances, CSM-1B no cuenta con protecciones integradas contra el uso indebido. Sesame ha optado por un enfoque de «código de honor», en el que simplemente urge a los desarrolladores a no utilizar el modelo para suplantar voces sin consentimiento o generar contenido engañoso. Esta falta de restricciones ha generado preocupación en la comunidad de seguridad digital, especialmente considerando el creciente uso de clonación de voz para fraudes y desinformación.

Un periodista de TechCrunch probó el modelo en la plataforma Hugging Face y descubrió que podía clonar su propia voz en menos de un minuto, generando declaraciones sobre temas sensibles sin ningún tipo de control. Organizaciones como Consumer Reports ya han advertido sobre la proliferación de herramientas de clonación de voz sin salvaguardas significativas.

El impacto de Maya y el futuro de Sesame

Sesame ha ganado notoriedad gracias a la presentación de Maya y su otro asistente, Miles. Estos sistemas han impresionado por su capacidad de respirar, usar pausas naturales y ser interrumpidos en tiempo real, acercándose al nivel de interacción humana que ofrecen soluciones como Voice Mode de OpenAI.

El interés en esta tecnología ha sido tal que Sesame ha atraído inversores de alto perfil, incluyendo a Andreessen Horowitz, Spark Capital y Matrix Partners. Además, la empresa ha revelado que está trabajando en gafas de realidad aumentada con su modelo de IA integrado, diseñadas para usarse durante todo el día.

Desde WWWhatsnew, consideramos que la decisión de Sesame de abrir su modelo es un avance importante para la comunidad de inteligencia artificial, pero también plantea interrogantes éticos. La facilidad con la que se puede clonar una voz o generar contenido automatizado subraya la necesidad de normativas más estrictas para evitar el uso malintencionado de esta tecnología.

Las grandes tecnológicas han comenzado a adoptar regulaciones internas, pero aún estamos lejos de un consenso global sobre cómo manejar estas herramientas. Mientras tanto, el potencial de CSM-1B para la innovación es innegable, y queda por ver cómo la comunidad de desarrolladores lo aprovechará.