Esta IA de Microsoft puede dibujar cualquier cosa que se le pida

Publicado el

Microsoft está desarrollando una nueva inteligencia artificial, que puede dibujar cualquier cosa, a partir de las descripciones de un texto. Y el proceso que realiza es fascinante.

Para que esta dinámica funcione, el “bot de dibujo” de Microsoft, utiliza la tecnologí­a GAN (Generative Adversarial Network), una red neuronal con dos modelos de aprendizaje automático. Es decir, es como si tuviera dos mentes enfrentadas, una lleva a cabo la tarea y la otra evalúa su desempeño analizando la autenticidad de las imágenes.

Microsoft

Sin embargo, GAN tiene limitaciones cuando se enfrente a textos con descripciones complejas, por lo que han desarrollado lo que llaman AttnGAN, que pueda agregar contexto a los dibujos que se les pide crear, llenando los espacios en blanco.

Es decir, utiliza un poco de “imaginación propia” agregando detalles que no se pidieron, gracias a su aprendizaje previo con conjuntos de datos de imágenes y leyendas.

Así­ que, si se pide que dibuje un pájaro con alas negros y cuerpo amarillo, como el ejemplo de la imagen anterior, la IA presentará el pájaro en una rama, aunque no se lo haya solicitado en el texto, ya que es una de las escenas más comunes en estos casos.

Aunque aún falta perfeccionar esta IA, el potencial es enorme así­ como sus múltiples aplicaciones, como se detalla en el documento de Microsoft.