Stable Diffusion XL – Un modelo mejorado ya disponible para probarlo

Publicado el

stable diffusion

La inteligencia artificial (IA) continúa evolucionando y ampliando sus capacidades en el ámbito de la generación de imágenes. La empresa Stability AI ha anunciado la versión beta de su último modelo, Stable Diffusion XL (SDXL), que promete llevar el hiperrealismo a otro nivel en el ámbito empresarial.

Stable Diffusion XL: Un salto cualitativo

El modelo SDXL se basa en 2.3 mil millones de parámetros, lo que lo hace considerablemente más potente que los modelos anteriores. Entre sus mejoras se encuentran la generación avanzada de rostros, una mayor calidad en la composición de imágenes y la capacidad de producir texto legible.

SDXL no solo permite generar imágenes a partir de texto, sino que también incluye nuevas funcionalidades como el image-to-image prompting, es decir, la posibilidad de obtener variaciones de una imagen a partir de otra. Además, cuenta con tecnologías de inpainting y outpainting, que permiten reconstruir partes faltantes de una imagen o extenderla de forma coherente, respectivamente.

Usan la etiqueta ‘XL’ porque este modelo está entrenado usando 2300 millones de parámetros, mientras que los modelos anteriores estaban en el rango de 900 millones de parámetros. Si bien el modelo SDXL es una mejora de la arquitectura del modelo 2.0, los modelos 3.0 aún están en desarrollo.

Lista de mejoras respecto a las versiones anteriores de Stable Diffusion

Las mejoras en Stable Diffusion XL (SDXL) respecto a las versiones anteriores de Stable Diffusion incluyen:

  • Mayor número de parámetros: SDXL cuenta con 2.3 mil millones de parámetros, en comparación con los 900 millones de parámetros de modelos anteriores. Esto permite un mayor aprendizaje y desempeño del modelo.
  • Hiperrealismo mejorado: El modelo SDXL ofrece un nivel de detalle y calidad en la generación de imágenes que supera a las versiones anteriores, lo que se traduce en imágenes más realistas.
  • Generación avanzada de rostros: SDXL ha mejorado su capacidad para generar rostros humanos, haciéndolos más realistas y coherentes en términos de características faciales y expresiones.
  • Composición de imágenes mejorada: El modelo SDXL es capaz de crear imágenes con una composición más elaborada y coherente, lo que resulta en escenas más convincentes y realistas.
  • Producción de texto legible: A diferencia de los modelos anteriores, SDXL tiene una mayor capacidad para generar texto legible en las imágenes, lo que puede ser útil en aplicaciones como la generación de anuncios o ilustraciones con texto.
  • Funcionalidad image-to-image prompting: SDXL va más allá del enfoque tradicional de texto a imagen e incluye la capacidad de generar variaciones de una imagen a partir de otra imagen.
  • Inpainting y outpainting: El modelo SDXL ofrece la posibilidad de reconstruir partes faltantes de una imagen (inpainting) y extender de manera coherente una imagen existente (outpainting).

Estas mejoras hacen que SDXL sea un modelo más potente y versátil en comparación con las versiones anteriores de Stable Diffusion, ampliando sus posibles aplicaciones en diversas industrias y ámbitos creativos.

¿Es comparable con Midjourney?

En las primeras pruebas, aún no. Con el prompt: a westie in armour, photo realistic, high definition, el nuevo modelo de SDXL genera esto en modo foto:

Stable Diffusion

Mientras que Midjourney sigue con sus resultados impresionantes:

midjourney

Podéis probarlo en beta.dreamstudio.ai.

En busca del equilibrio entre la creatividad y la ética

Stability AI ha enfrentado desafíos en el campo de la propiedad intelectual, con artistas que se oponen al uso de sus obras como datos de entrenamiento para los modelos de Stable Diffusion. La empresa ha colaborado con la organización Spawning para respetar las solicitudes de los artistas de no utilizar su trabajo en el entrenamiento de futuros modelos.

La compañía ha sido objeto de demandas por violación de derechos de autor en relación con la creación de arte a través de la inteligencia artificial, incluyendo la agencia de imágenes Getty Images, que demandó por un supuesto uso indebido de sus imágenes.