La inteligencia artificial ha estado siendo puesta al servicio de diferentes sectores. Uno de ellos ha sido el artístico, en el cual hemos visto como esta tecnología está siendo usada en el desarrollo de herramientas generadoras de imágenes a partir de texto como DALL-E y Stable Diffusion, las cuales facilitan notablemente el proceso creativo tradicional.

Así también, la inteligencia artificial ha permitido la creación de herramientas generadoras de video a partir de texto.

Pero ahí no acaba todo entre la inteligencia artificial y lo multimedia, ya que recientemente se dio a conocer el lanzamiento de una herramienta que sería algo así como el DALL-E del sonido.

Se trata de AudioGen, un generador de audio que hace su trabajo a partir de descripciones textuales.

En ese sentido, un equipo conformado por investigadores de Meta y de la Universidad Hebrea de Jerusalén explicaron que AudioGen funciona a partir de un modelo generativo autorregresivo, el cual se encarga de interpretar las peticiones textuales del usuario para generar el audio final.

We present “AudioGen: Textually Guided Audio Generation”!

AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio).

📖 Paper: https://t.co/XKctRaShN1

🎵 Samples: https://t.co/e7vWmOUfva

💻 Code & models – soon!

(1/n) pic.twitter.com/UiJaA627bv

— Felix Kreuk (@FelixKreuk) September 30, 2022