Meta presenta cuatro nuevos modelos de IA para desarrolladores

Publicado el

En un movimiento que promete mover el desarrollo de aplicaciones de inteligencia artificial, el equipo de Investigación Fundamental de IA de Meta ha lanzado cuatro nuevos modelos de IA al público. Estos modelos, diseñados para mejorar diversas áreas del procesamiento de datos y la generación de contenido, ya están disponibles para investigadores y desarrolladores.

JASCO: Innovación en la Creación de Sonidos

El primero de estos modelos, JASCO, está diseñado para aceptar diferentes tipos de entrada de audio y generar una mejora en el sonido. Este modelo permite a los usuarios ajustar características como el sonido de los tambores, acordes de guitarra o incluso melodías completas, permitiendo así crear una pieza musical única.

Por ejemplo, puedes pedirle a JASCO que genere una melodía de blues con mucho bajo y batería, y luego detallar las características de otros instrumentos. En pruebas comparativas, JASCO ha superado a otros sistemas similares en tres métricas principales.

Usos de JASCO

  • Producción Musical: Permite a los productores ajustar y personalizar sonidos específicos.
  • Mejora de Calidad de Audio: Ideal para mejorar grabaciones existentes.
  • Creación de Nuevas Melodías: Acepta entradas de texto para generar música basada en descripciones detalladas.

AudioSeal: Protección de Contenido de Voz

Otro de los modelos presentados es AudioSeal, que se centra en añadir marcas de agua a los discursos generados por aplicaciones de IA. Estas marcas permiten identificar fácilmente si un contenido ha sido generado artificialmente. Además, AudioSeal puede marcar segmentos de discursos artificiales que se han añadido a discursos reales. Este modelo se lanzará con una licencia comercial, lo que abre una amplia gama de aplicaciones para empresas y desarrolladores.

Aplicaciones de AudioSeal

  • Verificación de Autenticidad: Útil para identificar discursos generados por IA.
  • Seguridad de Contenidos: Protege la propiedad intelectual de los creadores.
  • Integración en Aplicaciones Comerciales: Facilita la adopción de IA en productos comerciales.

Chameleon: Modelos de Texto a Imagen

Finalmente, Meta ha introducido dos versiones del modelo Chameleon: 7B y 34B. Ambos modelos están diseñados para convertir texto en representaciones visuales, aunque actualmente se lanzan con capacidades limitadas. Estos modelos necesitan comprender tanto el texto como las imágenes, lo que les permite realizar procesamientos inversos, como generar descripciones para imágenes.

Funcionalidades de Chameleon

  • Generación de Imágenes a Partir de Texto: Ideal para aplicaciones creativas y de marketing.
  • Descripción de Imágenes: Útil en herramientas de accesibilidad y organización de contenido visual.
  • Mejoras en la Interacción Humano-Computadora: Facilita la comunicación a través de interfaces más intuitivas.

La liberación de estos cuatro modelos de IA por parte de Meta representa un paso significativo hacia el avance de la inteligencia artificial accesible y aplicable a una variedad de campos. Desde la creación musical hasta la protección de contenido y la generación de imágenes, estas herramientas ofrecen nuevas posibilidades para desarrolladores e investigadores.

Comparte en: