Actualmente, si queremos crear imágenes con Inteligencia artificial, necesitamos tener acceso a Midjourney, Dall-E y semejantes, ya que requiere mucho poder computacional, por lo que es necesario un pago para hacerlo.
El caso es que hay opciones de código libre que pueden evitar eso, y hoy hablaré de una de ellas.
DemoFusion surge como una herramienta innovadora en el campo de la generación de imágenes por inteligencia artificial (AI), desarrollada por el equipo del Profesor Yi-Zhe Song en la Universidad de Surrey. Esta tecnología se destaca por permitir a los usuarios generar imágenes de alta resolución sin necesidad de recurrir a computadoras de gran potencia o servicios de suscripción costosos. Esta herramienta accesible y de fácil uso promete abrir nuevos caminos en el mundo del arte digital y la creatividad, ofreciendo posibilidades hasta ahora limitadas a aquellos con recursos significativos.
DemoFusion se basa en un enfoque único para la generación de imágenes AI. A diferencia de los métodos tradicionales que requieren hardware de alta gama, esta herramienta permite a los usuarios generar imágenes básicas utilizando modelos AI open-source, como Stable Diffusion, para luego mejorarlas notablemente. La clave de su funcionamiento reside en la mejora de las imágenes de baja resolución, extrayendo más detalles del modelo AI.
Este proceso se lleva a cabo trabajando la imagen en parches, lo cual permite mejorar la resolución y el detalle hasta en 16 veces respecto a la imagen original. Es importante destacar que este no es un simple método de escalado, sino una técnica que potencia la capacidad del modelo AI para generar imágenes más detalladas y coherentes. Este avance técnico representa un gran paso hacia adelante en el campo de la imaginería generada por AI, al hacer posible la creación de imágenes de alta calidad sin requerir recursos computacionales extensivos.
La accesibilidad es uno de los pilares fundamentales de DemoFusion. Esta herramienta está diseñada para ser utilizada en computadoras de gama media, como las PCs de gaming o incluso los Mac M1, lo cual la hace accesible a un público mucho más amplio. Esta accesibilidad rompe con la barrera de entrada que suponían los altos costes de hardware o las suscripciones a servicios especializados en generación de imágenes AI, como Midjourney o DALLE-3.
La visión detrás de DemoFusion es clara: democratizar el acceso a la generación de imágenes de alta resolución, permitiendo que más personas, independientemente de su capacidad económica o acceso a recursos tecnológicos avanzados, puedan explorar y crear en el ámbito del arte digital y la imaginería.
Al comparar DemoFusion con otras herramientas de generación de imágenes AI, es fundamental destacar su singular enfoque en la mejora de resolución y detalle. Mientras que herramientas como SDXL y MultiDiffusion se enfocan en diferentes aspectos de la generación de imágenes, DemoFusion se distingue por su capacidad para mantener una coherencia semántica global en imágenes de alta resolución.
- Resolución y Detalle: A diferencia de las técnicas de generación directa o fusión de múltiples caminos de desruido (como en MultiDiffusion), DemoFusion incrementa significativamente la resolución y el detalle de las imágenes, superando a menudo en 16 veces la calidad de las imágenes base.
- Coherencia Semántica: Un desafío común en la generación de imágenes AI es mantener un contexto y significado coherentes a lo largo de toda la imagen. DemoFusion logra este equilibrio, ofreciendo no solo imágenes de alta calidad, sino también manteniendo la integridad semántica y estética.
- Requerimientos de Hardware: Mientras que otras soluciones requieren hardware de alto rendimiento, DemoFusion funciona eficientemente en hardware de gama media, lo que la hace más accesible para un público general.
- Facilidad de Uso: Al basarse en modelos AI open-source y no requerir entrenamiento adicional del modelo, DemoFusion es notablemente fácil de usar, lo que permite a los usuarios experimentar y crear sin necesidad de conocimientos técnicos avanzados.
Esta comparación técnica subraya la posición única de DemoFusion en el panorama de las herramientas de generación de imágenes AI, destacándose por su accesibilidad, calidad de imagen y mantenimiento de la coherencia global.
Fuente: DemoFusion: Democratising High-Resolution Image Generation With No $$$ https://arxiv.org/abs/2311.16973
Ya que de momento es un estudio, no un producto final, tendremos que seguir usando Stable Diffusion de forma tradicional en nuestro ordenador, aunque consuma más.
Para hacerlo, sigue estos pasos:
- Descargar Stable Diffusion UI desde GitHub: Visita la página de GitHub de Stable Diffusion UI. Este proyecto proporciona un archivo BAT que facilita la instalación descargando todos los componentes necesarios. Elige el enlace correspondiente a tu sistema operativo (Windows o Linux) y descarga el archivo ZIP.
- Extraer y Mover la Carpeta Descargada: Extrae el contenido del archivo ZIP. Mueve la carpeta extraída a la raíz de tu unidad de almacenamiento (por ejemplo, C:\stable-diffusion-ui). Esto ayuda a evitar problemas durante la instalación.
- Ejecutar el Archivo de Instalación: Abre el archivo ‘Start Stable Diffusion UI.cmd’. Observa en la ventana de comandos cómo se descargan los componentes necesarios. Este proceso puede tardar más de 10 o 15 minutos, dependiendo de tu hardware y conexión a Internet.
- Acceder a Stable Diffusion: Al finalizar la instalación, se abrirá automáticamente una página en tu navegador con la URL ‘https://localhost:9000’. Esta es la interfaz web de Stable Diffusion, donde puedes introducir descripciones para generar imágenes y ajustar configuraciones avanzadas. Si la interfaz muestra el mensaje ‘Stable Diffusion is starting’ por mucho tiempo, cierra la ventana de comandos y vuelve a abrirla usando el archivo ‘Start Stable Diffusion UI.cmd’.
- Generar Imágenes: Cada vez que desees usar Stable Diffusion, inicia el programa desde el mismo archivo BAT utilizado para la instalación. En la interfaz web, ingresa la descripción de la imagen que deseas generar y ajusta las configuraciones según tus preferencias. Puedes guardar imágenes en alta resolución y, en los ajustes avanzados, encontrarás opciones para corregir aspectos como las caras deformadas en las imágenes.
- Actualizaciones Automáticas: Stable Diffusion actualizará automáticamente los paquetes al ejecutar el archivo BAT, manteniendo así la herramienta actualizada sin esfuerzo adicional por tu parte. Este proceso simplifica la instalación y uso de Stable Diffusion, haciéndolo accesible incluso para aquellos sin experiencia en la configuración de entornos de desarrollo o librerías complejas.