La IA se está quedando sin “combustible”: por qué faltan datos y cómo China quiere adelantarse

Durante años, entrenar modelos de inteligencia artificial se parecía a llenar un depósito en una gasolinera infinita: bastaba con extraer más y más contenido de la web. Esa idea empieza a resquebrajarse. Investigadores de Epoch AI han advertido que el texto de alta calidad disponible públicamente podría agotarse en algún punto entre 2026 y 2032, con un grado alto de probabilidad según sus estimaciones. Continúa leyendo «La IA se está quedando sin “combustible”: por qué faltan datos y cómo China quiere adelantarse»

OpenAI transcribió millones de vídeos de Youtube para entrenar a ChatGPT

Las empresas buscan incansablemente datos para entrenar sus modelos, empujando las fronteras de lo que es legalmente aceptable. Esta semana, un informe del New York Times sacó a la luz cómo compañías como OpenAI y Google han recurrido a métodos creativos para acumular estos valiosos datos, incluyendo la transcripción de millones de horas de contenido de YouTube.

Continúa leyendo «OpenAI transcribió millones de vídeos de Youtube para entrenar a ChatGPT»