RLHF | WWWhat's new

Si estás metido en el mundo de la Inteligencia artificial te interesará saber que Google Research ha presentado PERL (Parameter Efficient Reinforcement Learning), una técnica que promete mejorar la eficiencia en el entrenamiento de los Modelos de Lenguaje Grandes (LLMs) mediante el Aprendizaje por Refuerzo a partir de Retroalimentación Humana (RLHF).

El objetivo de esta técnica es solucionar dos problemas que tenemos en el sector: el alto costo computacional y la complejidad existente casi siempre en el proceso de entrenamiento de estos modelos.

Continúa leyendo «Google presenta PERL, pero no el PERL que estás pensando»