Durante años, entrenar modelos de inteligencia artificial se parecía a llenar un depósito en una gasolinera infinita: bastaba con extraer más y más contenido de la web. Esa idea empieza a resquebrajarse. Investigadores de Epoch AI han advertido que el texto de alta calidad disponible públicamente podría agotarse en algún punto entre 2026 y 2032, con un grado alto de probabilidad según sus estimaciones. Continúa leyendo «La IA se está quedando sin “combustible”: por qué faltan datos y cómo China quiere adelantarse»
Etiqueta: Datos de entrenamiento
OpenAI transcribió millones de vídeos de Youtube para entrenar a ChatGPT
Las empresas buscan incansablemente datos para entrenar sus modelos, empujando las fronteras de lo que es legalmente aceptable. Esta semana, un informe del New York Times sacó a la luz cómo compañías como OpenAI y Google han recurrido a métodos creativos para acumular estos valiosos datos, incluyendo la transcripción de millones de horas de contenido de YouTube.
Continúa leyendo «OpenAI transcribió millones de vídeos de Youtube para entrenar a ChatGPT»