Autores demandan a NVIDIA por uso de libros en entrenamiento de IA

Publicado el

justicia

Recientemente, un grupo de autores estadounidenses ha iniciado una demanda de infracción de derechos de autor contra NVIDIA, la gigante tecnológica conocida por liderar la revolución de la IA y por su impresionante línea de unidades de procesamiento gráfico (GPUs).

El caso no es sencillo de juzgar, ya que por un lado parece que NVIDIA ha usado conteido «pirata», mientras que por otro lado eso es algo difícil de comprobar.

La esencia de esta disputa radica en el uso del conjunto de datos Books3, creado por el investigador de IA Shawn Presser en 2020, y ya usado por Meta para su propio entrenamiento. Presser recopiló este conjunto al extraer contenido del sitio de piratería Bibliotik, un acto que no pasó desapercibido por los defensores de los derechos de autor. Books3 se integró posteriormente en ‘The Pile’, otro conjunto de datos utilizado para entrenar modelos de IA, incluidos los modelos NeMo Megatron de NVIDIA.

La acusación de los autores, entre los que se encuentran Abdi Nazemian, Brian Keene y Stewart O’Nan, sostiene que al entrenar sus modelos con ‘The Pile’, NVIDIA ha utilizado indirectamente obras protegidas por derechos de autor sin consentimiento. Esto, según ellos, constituye una infracción directa de sus derechos.

Este caso pone de manifiesto el delicado equilibrio entre fomentar la innovación tecnológica y respetar los derechos de propiedad intelectual. La defensa de uso justo podría ser una vía de escape para NVIDIA, aunque el precedente establecido por casos similares, como el de OpenAI, sugiere un camino legal complejo y lleno de matices.

Personalmente, creo que este caso recalca la necesidad urgente de establecer marcos legales claros y justos que guíen el uso de contenido protegido en el entrenamiento de modelos de IA. La falta de directrices claras no solo pone en riesgo a las empresas tecnológicas sino que también amenaza la integridad y el sustento de los creadores de contenido.

La demanda contra NVIDIA no es un caso aislado, estamos viendo este tipo de acciones constemente, con una creciente preocupación por cómo la tecnología de IA se nutre del trabajo creativo. Es fundamental que como sociedad encontremos un equilibrio que permita tanto la innovación como la protección eficaz de los derechos de autor.