La reciente controversia entre OpenAI y DeepSeek ha generado un intenso debate sobre la ética del entrenamiento de modelos de inteligencia artificial. OpenAI afirma que DeepSeek ha entrenado sus modelos con datos obtenidos de manera indebida a través de la API de OpenAI, lo que ha llevado a la empresa a abrir una investigación y dialogar con funcionarios gubernamentales sobre el asunto.
El conflicto OpenAI vs. DeepSeek
Durante una entrevista en Bloomberg TV, el jefe de asuntos globales de OpenAI, Chris Lehane, confirmó que la compañía ha discutido el caso con autoridades gubernamentales, argumentando que DeepSeek ha utilizado salidas generadas por su IA para entrenar su propio modelo sin permiso.
Sin embargo, algunos han señalado una contradicción en la postura de OpenAI. Mientras la empresa acusa a DeepSeek de aprovecharse de su tecnología, ella misma enfrenta demandas por derechos de autor, incluyendo una interpuesta por The New York Times, que la acusa de entrenar sus modelos con contenido protegido sin autorización.
¿Doble moral? La defensa de OpenAI
Lehane intentó diferenciar las prácticas de OpenAI de las de DeepSeek con una metáfora literaria:
- Comparó el uso de contenidos para entrenar IA con «leer un libro de biblioteca y aprender de él».
- Mientras que, en el caso de DeepSeek, argumenta que tomaron el contenido, le cambiaron la portada y lo vendieron como propio.
Esta distinción recuerda la misma línea de defensa de OpenAI en su disputa legal con los medios de comunicación, lo que ha llevado a algunos expertos a cuestionar si se trata de una postura coherente o simplemente de una estrategia para proteger su posición en el mercado.
El problema del «entrenamiento por destilación»
El caso de DeepSeek es un ejemplo del debate en torno a la destilación de modelos de IA, una técnica en la que un modelo de menor tamaño aprende de un modelo más grande. Esto plantea preguntas éticas y legales sobre hasta qué punto una empresa puede extraer conocimiento de otro sistema de IA sin infringir derechos.
El futuro del debate sobre derechos de entrenamiento de IA
El conflicto entre OpenAI y DeepSeek resalta la falta de claridad legal en torno al uso de datos para entrenar modelos de IA. Con casos como el de The New York Times contra OpenAI y este nuevo enfrentamiento, es probable que los reguladores y los tribunales deban intervenir para establecer límites claros sobre qué constituye un uso legítimo de datos en el entrenamiento de modelos de IA.
Desde WWWhatsnew, creemos que este debate será clave para definir el futuro de la inteligencia artificial y su regulación. Empresas como OpenAI deben encontrar un equilibrio entre proteger su tecnología y respetar las normativas sobre derechos de autor y propiedad intelectual.