Un Balrog jugando al ajedrez, un ejemplo de lo que puede crear DALL-E mini de forma gratuita

Publicado el

balrog jugando ajedrez

Poco más de un minuto es lo que ha tardado la nueva Inteligencia Artificial DALL-E mini en crear una imagen a partir de un texto.

Le dije «Un balrog jugando al ajedrez», y la imagen superior es el resultado, mucho menos realista de lo que promete la impresionante DALL-E 2, pero por lo menos está abierta al público.

Disponible en este enlace, y después de estar varios días con el acceso bloqueado debido a la enorme cantidad de visitas, su funcionamiento es realmente sencillo: le decimos lo que queremos que cree, en inglés, y esperamos las imágenes inventadas por el motor inteligente. En este caso imaginó al Balrog a partir de las imágenes encontradas en Internet del famoso monstruo de «El Señor de los Anillos».

El proyecto ha sido creado por Boris Dayma, y se hizo viral en muy poco tiempo. DALL·E mini es un modelo de IA que puede generar imágenes a partir de cualquier indicación que le demos, y tiene su repositorio en GitHub para que los desarroladores puedan ejecutar o entrenar sus propios modelos.

El modelo se entrena mirando millones de imágenes de Internet con sus leyendas asociadas. Con el tiempo, aprende a dibujar una imagen a partir de un mensaje de texto. Aún sigue aprendiendo, de forma que irá perfeccionando los resultados.

Lo sorprendente es que es capaz de crear imágenes únicas que no existen, como el Balrog que ilustra este artículo o los ejemplos que ya pueden encontrarse por Twitter.

Para lograr los resultados se combinan varios modelos:
– Un codificador de imágenes que convierte imágenes sin procesar en una secuencia de números con su decodificador asociado.
– Un modelo que convierte un mensaje de texto en una imagen codificada.
– Un modelo que juzga la calidad de las imágenes generadas para un mejor filtrado.

Una amenaza a las imágenes de stock

En un futuro podremos usar sistemas de este tipo para crear lo que queramos. Imaginad el escenario: imágenes únicas con lo que queramos para ilustrar artículos o anunciar productos ¿el fin de las imágenes de stock?.

Actualmente existen muchos bancos de imágenes que permiten obtener fotos de casi todo tipo. Algunos están integrados dentro de editores online, como Canva, lo que facilita aún más la creación de banners.

Ahora imaginad que tengo que escribir un artículo sobre los problemas de seguridad de un router. Le pido a DALL-E que haga una imagen con «un hacker atacando un router», y este es el resultado:

hacker atacando router

Mucho más práctico que buscar una foto de stock, y además obtenemos una imagen única, que nadie ha usado nunca, y que cumpla con todos los requisitos que deseemos.

Aún debe ganar realismo, claro, pero para eso está DALL-E 2, con resultados prácticamente perfectos, aunque seguramente, en el futuro, cuando esté abierto, el coste de una foto generada no será inferior al de una fotografía de stock.

Los peligros de este tipo de aplicaciones

Todo lo bueno tiene un lado oscuro. Si entregamos una herramienta capaz de generar cualquier imagen, realista, a partir de texto, las Fake News se multiplicarán de forma impresionante, las redes sociales estarán bombardeadas de «fotos» que nunca se hicieron, y los algoritmos de detección tendrán que ponerse las pilas para que, de alguna forma, consigan identificar ese nuevo material.

Se aproximan años interesantes en este sector.

Comparte en: