Hoy en día, la inteligencia artificial está en todas partes. Desde el asistente virtual en tu teléfono hasta las sugerencias de series en tu plataforma de streaming favorita. Pero, ¿te has puesto a pensar de dónde sacan las empresas de tecnología toda esa información para entrenar a estos sistemas? Spoiler: de textos. Muchos textos. Y ahí es donde comienza una batalla silenciosa entre los gigantes tecnológicos y las editoriales.
Hace poco, Penguin Random House, una de las editoriales más grandes del mundo, decidió tomar una medida que está dando de qué hablar: van a incluir advertencias en sus libros para evitar que se utilicen en el entrenamiento de modelos de inteligencia artificial generativa. Pero ¿por qué esto es relevante para ti y para el futuro de los contenidos que consumes? Vamos a desglosarlo.
¿Qué está pasando con los libros y la IA?
Vamos a ponerlo simple. Para que la IA funcione, necesita aprender de algo. Piensa en un niño que aprende a leer; le das libros, le enseñas el alfabeto, lo corriges cuando se equivoca. Pues con la IA es similar. Las empresas tecnológicas entrenan sus modelos de lenguaje dándoles toneladas de texto para que “aprendan” a hablar, responder preguntas y escribir como un ser humano. ¿Y de dónde sale todo ese texto? De internet, libros, artículos, lo que sea que esté disponible.
Y aquí es donde viene el conflicto. Las editoriales, como Penguin Random House, han dicho “¡Basta!” y han empezado a incluir en sus libros una advertencia clara: su contenido no puede ser utilizado para entrenar a estos modelos sin permiso. Básicamente, le están diciendo a las empresas de tecnología que no pueden tomar sus textos para sus propios fines, y esto podría cambiar mucho las reglas del juego.
Pero… ¿qué tiene que ver esto contigo?
Quizás estés pensando, “bueno, yo no soy autor ni trabajo en una editorial, ¿por qué debería preocuparme?” Pero piensa un momento: ¿te gustaría que todo lo que escribes o publicas en línea fuera utilizado sin tu consentimiento para entrenar una inteligencia artificial? Tal vez ahora no parece un gran problema, pero en un futuro, cuando más y más contenido sea generado por IA, podríamos empezar a ver cómo las obras originales pierden valor y reconocimiento.
Penguin Random House está defendiendo el derecho de los autores a decidir cómo se utiliza su trabajo. Es como si tú creas algo increíble, y de repente lo ves replicado en miles de versiones automatizadas, sin haber recibido ni crédito ni compensación. No suena justo, ¿verdad?
En WWWhat’s new siempre hemos estado al tanto de estos movimientos en el mundo de la tecnología. Las grandes empresas, como Google y Microsoft, llevan años entrenando sus sistemas con textos de todo tipo. De hecho, hablamos constantemente de cómo la IA está impactando la creación de contenido y lo que esto significa para los creadores, tanto en lo bueno como en lo malo. Y esta medida de Penguin Random House marca un antes y un después.
Imagínate un futuro donde las editoriales, escritores independientes, y hasta pequeños blogs empiezan a unirse en esta lucha por proteger lo que es suyo. Podría ser un golpe fuerte para la forma en que se está construyendo la inteligencia artificial hoy en día.
La trampa del acceso libre al conocimiento
Hablemos de otro punto interesante. Durante mucho tiempo, el acceso libre al conocimiento ha sido un tema central en internet. Hay algo hermoso en que podamos acceder a información y libros que, en otra época, hubieran sido inaccesibles para muchos. Pero ese acceso libre también tiene sus trampas. Porque no es lo mismo leer un libro para aprender, que extraer su contenido de forma masiva para entrenar una máquina. El problema radica en la escala y en cómo se usa.
Penguin Random House está diciendo: “Puedes leer nuestros libros, claro, pero no puedes usarlos para enseñar a una IA sin nuestro permiso.” Y, sinceramente, es un argumento que tiene sentido. Hay una gran diferencia entre una persona usando un libro para aprender y una máquina usando ese mismo libro para volverse más inteligente sin retribuir nada a cambio.
¿Qué sigue para las editoriales y la IA?
Esto podría ser solo el comienzo. Es probable que más editoriales se sumen a la iniciativa de Penguin Random House y empiecen a tomar acciones similares. Si lo piensas bien, es un paso natural para proteger no solo los derechos de autor, sino también el valor del trabajo creativo en un mundo donde las máquinas empiezan a crear por sí mismas.
Es posible que, en un futuro, veamos reglas más estrictas sobre cómo las empresas tecnológicas pueden acceder a contenido protegido por derechos de autor. Esto podría incluso abrir una nueva discusión sobre cómo regular el uso de datos para entrenar inteligencias artificiales, un tema que seguramente dará de qué hablar en los próximos años.
Un futuro en juego
Todo este tema pone sobre la mesa una pregunta interesante: ¿quién controla el conocimiento en la era digital? Porque no se trata solo de libros, sino de todo tipo de contenido. Los creadores están empezando a darse cuenta de que sus trabajos, aunque publicados en línea o en papel, pueden ser utilizados de maneras que jamás imaginaron. Y tal vez, solo tal vez, estamos a tiempo de poner límites para que el futuro de la creación no sea completamente automatizado y sin alma.
Así que la próxima vez que leas sobre inteligencia artificial o veas que una máquina responde tus preguntas con fluidez, acuérdate de que detrás de esa IA hay textos, muchos textos, que alguien, en algún lugar, escribió con dedicación y esfuerzo. Y la batalla por proteger esos textos apenas está comenzando.