Nuevo editor de imágenes con Inteligencia Artificial de Apple

Publicado el

Recientemente, Apple ha lanzado un rayo de innovación en el campo de la inteligencia artificial aplicada a la edición de imágenes, una noticia que ha capturado mi atención y seguramente la de muchos de vosotros. Se trata del MGIE (MLLM-Guided Image Editing), un modelo de IA de código abierto que promete revolucionar la manera en que interactuamos con nuestras fotografías. Este avance, desarrollado en colaboración con la Universidad de California, Santa Bárbara, es un claro indicativo de que Apple está poniendo en marcha su maquinaria AI, preparando el terreno para lo que será el lanzamiento de iOS 18, esperado con ansias por sus nuevas características de inteligencia artificial.

¿Qué es el MGIE y cómo funciona?

El MGIE representa un salto cualitativo en la edición de imágenes, permitiendo a los usuarios modificar fotos mediante comandos simples en lenguaje natural. Imaginen decirle a su ordenador «haz que esta pizza se vea más saludable» o «elimina esa persona del fondo» y que se realice sin más. Esto es lo que promete el MGIE, gracias a su motor, un modelo de lenguaje grande multimodal (MLLM) que no solo interpreta texto, sino también imágenes y sonidos, para entender y ejecutar comandos de edición de forma precisa.

Tres modalidades de edición

El MGIE se enfoca en tres grandes áreas de edición:

  • Modificación al estilo Photoshop: Incluye acciones como recortar, rotar y cambiar fondos.
  • Optimización global de la foto: Ajusta efectos que impactan toda la imagen, como brillo, contraste o nitidez.
  • Edición local: Modifica áreas específicas, afectando su forma, tamaño y color.

Esta versatilidad abre un abanico de posibilidades para profesionales y aficionados por igual, desde ajustes sutiles hasta transformaciones radicales de las imágenes.

Ejemplos obtenidos del estudio enlazado en el artículo de WWWhatsnew
Ejemplos obtenidos del estudio enlazado en el artículo de WWWhatsnew

Lo que distingue al MGIE de otras herramientas de edición de imágenes basadas en IA, como las que ofrece Photoshop, es su capacidad para interpretar y ejecutar comandos vagos o subjetivos, algo que históricamente ha sido un desafío para la inteligencia artificial. La investigación detrás de MGIE muestra ejemplos impresionantes de su capacidad, como añadir rayos a una imagen y hacer que el agua refleje esa iluminación, transformar objetos en otros completamente diferentes o incluso eliminar texto de fotos sin alterar el resto de la imagen.

Cómo probar el MGIE

Aunque el modelo es de código abierto y disponible para quien quiera integrarlo a sus propias herramientas, hay una demostración en línea ofrecida por los investigadores que permite subir una imagen y editarla mediante un comando. Sin embargo, la popularidad de esta demo ha generado largas colas de espera, reflejando el enorme interés que ha despertado esta innovación.

Está disponible en huggingface.co

Mi visión sobre el MGIE

Desde mi experiencia después de muchos años como consultor en este sector, veo el MGIE no solo como una herramienta de edición de fotos avanzada sino como un testimonio del potencial casi ilimitado de la inteligencia artificial en el ámbito creativo. Esta iniciativa de Apple, en colaboración con académicos, demuestra el compromiso de la compañía con la innovación en IA, y marca un punto de inflexión en cómo podríamos interactuar con nuestras herramientas digitales en el futuro.

A medida que Apple se prepara para integrar posiblemente MGIE en sus plataformas, este 2024 se perfila como un año emocionante para la tecnología AI. Estoy ansioso por ver cómo esta tecnología evoluciona y se incorpora en nuestras vidas diarias, transformando no solo nuestra relación con las imágenes sino con la creatividad digital en su conjunto. Desde WWWhatsnew, seguiremos de cerca estos desarrollos, brindándoles siempre las últimas novedades en el fascinante mundo de la tecnología.

Comparte en: