Los agentes de inteligencia artificial que prometen hacer tareas por nosotros, desde programar hasta comprar por internet, están lejos de alcanzar ese ideal de autonomía que muchos CEO de tecnológicas han imaginado. Si bien modelos como ChatGPT o Comet ya muestran destellos de esa visión, siguen siendo limitados cuando se enfrentan a tareas complejas en entornos reales. Ante este reto, los líderes de la industria están apostando por un nuevo enfoque: los entornos de aprendizaje por refuerzo (o entornos RL, por sus siglas en inglés).
Estos entornos funcionan como simuladores sofisticados donde los agentes pueden practicar tareas paso a paso, recibiendo recompensas por sus aciertos y aprendiendo de sus errores. Es el equivalente digital a poner a un aprendiz en un laboratorio donde puede equivocarse sin consecuencias reales, pero con una supervisión que ajusta constantemente su formación. Continúa leyendo «Silicon Valley apuesta por los entornos de entrenamiento para agentes de IA»

