Etiqueta: Datos de entrenamiento

La IA se está quedando sin “combustible”: por qué faltan datos y cómo China quiere adelantarse

Publicado el 11 junio, 2026

Durante años, entrenar modelos de inteligencia artificial se parecía a llenar un depósito en una gasolinera infinita: bastaba con extraer más y más contenido de la web. Esa idea empieza a resquebrajarse. Investigadores de Epoch AI han advertido que el texto de alta calidad disponible públicamente podría agotarse en algún punto entre 2026 y 2032, con un grado alto de probabilidad según sus estimaciones. Continúa leyendo «La IA se está quedando sin “combustible”: por qué faltan datos y cómo China quiere adelantarse»

OpenAI transcribió millones de vídeos de Youtube para entrenar a ChatGPT

Publicado el 7 abril, 2024

por Juan Diego Polo

Las empresas buscan incansablemente datos para entrenar sus modelos, empujando las fronteras de lo que es legalmente aceptable. Esta semana, un informe del New York Times sacó a la luz cómo compañías como OpenAI y Google han recurrido a métodos creativos para acumular estos valiosos datos, incluyendo la transcripción de millones de horas de contenido de YouTube.

Continúa leyendo «OpenAI transcribió millones de vídeos de Youtube para entrenar a ChatGPT»