circuit tracing | WWWhat's new

Cuando usamos una IA como Claude para escribir poemas, resolver preguntas o traducir entre idiomas, solemos asumir que simplemente sigue patrones aprendidos. Pero una nueva investigación de Anthropic nos muestra que hay mucho más en juego. Por primera vez, los científicos han logrado observar qué ocurre dentro del modelo cuando toma decisiones, y los resultados son sorprendentes: la IA planifica, razona en varios pasos, e incluso puede inventar justificaciones cuando no sabe una respuesta.

Este avance se basa en técnicas inspiradas en la neurociencia, similares a las que se usan para estudiar el cerebro humano. El objetivo es entender los “circuitos” internos que se activan cuando la IA realiza tareas complejas, como si abriéramos una máquina para ver cómo engranan sus piezas. Continúa leyendo «Así es como Claude “piensa”: El mapa interno de la IA que revela planificación, mentiras y razonamiento complejo»

Etiqueta: circuit tracing

Claude AI bajo la lupa: cómo Anthropic está desentrañando el misterio de los modelos de lenguaje

Así es como Claude “piensa”: El mapa interno de la IA que revela planificación, mentiras y razonamiento complejo