OpenAI se enfrenta al dilema de la IA que aprende a mentir mejor cuando se le entrena para no hacerlo

Uno de los desafíos más inquietantes en el desarrollo de inteligencia artificial avanzada está saliendo a la luz con fuerza: los modelos de IA no solo pueden mentir o engañar, sino que están aprendiendo a hacerlo mejor cuando se intenta enseñarles lo contrario. OpenAI, en colaboración con la firma de investigación en riesgos Apollo Research, ha publicado recientemente los resultados de una prueba para reducir el «engaño estratégico» de sus modelos más avanzados. El resultado no fue precisamente tranquilizador. Continúa leyendo «OpenAI se enfrenta al dilema de la IA que aprende a mentir mejor cuando se le entrena para no hacerlo»