Problemas de derechos de autor en Midjourney y DALL-E 3

Cuando hablamos de inteligencia artificial (IA) generativa de imágenes, particularmente en plataformas como Midjourney y DALL-E 3 de OpenAI, tenemos que tener mucho cuidado en lo que respecta a derechos autorales.

Ahora se ha identificado un problema significativo relacionado con el plagio visual y textual. Este análisis se basa en un estudio detallado realizado por Gary Marcus y Reid Southen, cuyos hallazgos se pueden explorar más a fondo en IEEE Spectrum. Comparto aquí una revisión objetiva y detallada de los puntos clave de su investigación, interpretando sus implicaciones en nuestro contexto tecnológico actual.

Reproducción exacta y plagio por modelos de IA

Se ha observado que los modelos de lenguaje de gran escala, como GPT-4, pueden reproducir textos de sus conjuntos de entrenamiento, incluyendo información privada como direcciones de correo electrónico y números de teléfono. Esto plantea serias preocupaciones sobre la privacidad y la seguridad de los datos.

Tanto en el ámbito textual como visual, se ha demostrado que estos modelos pueden generar contenidos que son prácticamente idénticos a materiales con derechos de autor, sin que el usuario lo solicite explícitamente. Esta situación puede exponer a los usuarios a reclamaciones por infracción de derechos de autor.

Desafíos legales y éticos

El caso de «The New York Times vs. OpenAI» sugiere que la reproducción casi textual por parte de la IA podría considerarse una infracción de derechos de autor. Esto plantea preguntas sobre la legalidad de las salidas generadas por la IA y su uso por parte de los usuarios finales. Existe una creciente preocupación sobre el uso no consensuado de obras protegidas por derechos de autor para entrenar estos modelos. Esto plantea un dilema ético, ya que el trabajo creativo de los individuos se utiliza sin su consentimiento para fines comerciales.

Experimentos reveladores

El caso es que experimentos realizados con Midjourney V6 mostraron su capacidad para recrear imágenes casi idénticas a escenas de películas y videojuegos famosos. Esto sugiere que el modelo fue entrenado con materiales con derechos de autor. Los modelos pueden generar réplicas de personajes con derechos de autor y marca registrada, como los de «Star Wars», incluso con instrucciones indirectas, lo que aumenta el riesgo de infracción inadvertida.

Le pedimos desde WWWhatsnew que haga un robot dorado que hable idiomas, y nos pone a C3PO… ¿por qué? porque se ha entrenado con las imágenes de Star Wars, no hay otra explicación. Se descubrió que incluso con instrucciones vagas, Midjourney podía evocar marcos enteros de películas, indicando una profunda integración de contenidos con derechos de autor en su sistema de entrenamiento.

Implicaciones para el desarrollo de la IA generativa

Las empresas detrás de estas tecnologías, como OpenAI y Midjourney, deben ser transparentes sobre sus fuentes de datos y asegurarse de que se respeten los derechos de autor. Es esencial desarrollar soluciones técnicas que eviten la generación de contenido con derechos de autor, así como adoptar enfoques éticos que respeten el trabajo creativo de los artistas y creadores. Los usuarios de estas plataformas deben ser conscientes de los riesgos de derechos de autor y estar informados sobre cómo sus acciones pueden violar involuntariamente estos derechos.

Aquí publiqué un vídeo mostrando cómo podemos tener más seguridad de que las imágenes generadas no violen derechos autorales, aunque la seguridad al 100% no existe nunca.

Desde mi perspectiva, estos hallazgos subrayan la necesidad de una mayor regulación y orientación ética en el campo de la IA generativa. Mientras que la tecnología ofrece posibilidades asombrosas, no debe avanzar a expensas de los derechos de los creadores y artistas. Es crucial equilibrar la innovación con la responsabilidad legal y ética.

Conclusión

Este análisis de spectrum.ieee.org revela una compleja intersección de tecnología, ley y ética en la IA generativa. Es imperativo abordar estos problemas para asegurar un futuro en el que la tecnología beneficie a la sociedad sin comprometer los derechos y el trabajo creativo de los individuos. A medida que avanzamos, debemos fomentar un diálogo continuo entre desarrolladores de IA, legisladores, artistas y el público para crear un entorno tecnológico que respete y proteja la propiedad intelectual.