NVIDIA responde a demandas por infracción de derechos de autor en entrenamiento de IA

Publicado el

nvidia

NVIDIA, el gigante de los semiconductores, se enfrenta a un nuevo desafío legal en el contexto del auge de la Inteligencia Artificial. En esta ocasión, un grupo de autores estadounidenses ha presentado una demanda en la que acusan a la compañía de infracción de derechos de autor al utilizar sus obras en el entrenamiento de modelos de IA sin permiso.

Recientemente, NVIDIA ha visto un impresionante crecimiento financiero. Sus ingresos trimestrales alcanzaron los 26 mil millones de dólares, un incremento del 340% en comparación con dos años atrás. Este éxito económico ha elevado significativamente el valor de la empresa, superando incluso el de todas las compañías públicas de Alemania combinadas. Sin embargo, este ascenso meteórico trae consigo nuevos problemas legales.

La demanda de los autores

Este año, varios autores presentaron una demanda colectiva contra NVIDIA. Alegan que la compañía utilizó obras protegidas por derechos de autor, obtenidas de sitios piratas como Bibliotik, para entrenar sus modelos de IA. Exigen una compensación por el uso no autorizado de sus trabajos.

La controversia de Books3

En el centro de la controversia se encuentra el dataset Books3, creado por el investigador de IA Shawn Presser en 2020. Presser recopiló datos de Bibliotik, un sitio conocido por albergar contenido pirata. Este dataset se integró en otras bases de datos, como «The Pile» de EleutherAI, que NVIDIA admite haber usado.

Los autores Abdi Nazemian, Brian Keene y Stewart O’Nan afirman que sus obras están en Books3 y que, por ende, NVIDIA entrenó sus modelos NeMo Megatron con estos textos, infringiendo sus derechos de autor.

La respuesta de NVIDIA

La pregunta central es si el uso de estos datos está permitido por la ley estadounidense. NVIDIA sostiene que no hay nada incorrecto en cómo entrenó su IA. En su respuesta oficial, la compañía reconoce haber utilizado «The Pile», pero niega haber hecho múltiples copias de Books3. También rechaza el término «biblioteca en la sombra» para describir sitios como Bibliotik y LibGen.

NVIDIA argumenta que alojar o distribuir datos de estos repositorios no necesariamente viola la Ley de Derechos de Autor de EE.UU. Según la compañía, los reclamos de los autores no son válidos bajo varias defensas afirmativas, incluyendo el uso justo.

Defensas afirmativas

NVIDIA menciona varias defensas en su respuesta:

  • Uso justo: La compañía argumenta que su uso de los datos está protegido bajo la sección 107 de la Ley de Derechos de Autor.
  • Falta de infracción: NVIDIA sostiene que no ha infringido los derechos de autor de los demandantes.
  • Elementos no protegibles: Algunos reclamos fallan porque se refieren a elementos que no están protegidos por la ley de derechos de autor.

Además, NVIDIA cuestiona la idoneidad de la demanda para tratamiento como acción colectiva bajo las reglas federales, aunque no detalla esta objeción.

Lo que viene

Los autores tienen ahora cuatro semanas para responder a la presentación de NVIDIA. Este caso, junto con otros similares contra empresas como OpenAI, Google y Meta, podría establecer precedentes importantes. Estos determinarán en gran medida hasta qué punto las empresas de IA pueden utilizar fuentes externas para entrenar sus modelos y cuándo se requiere compensación.

Este tipo de demandas resaltan los desafíos legales y éticos que acompañan al rápido avance de la IA. La comunidad tecnológica y legal seguirá de cerca el desarrollo de estos casos.

Comparte en: