Mover un reactor nuclear en avión suena a escena de thriller, pero el Departamento de Defensa de Estados Unidos lo ha convertido en un ejercicio logístico casi rutinario. En un hito que la administración presenta como “primero en el mundo”, la Fuerza Aérea transportó por aire un microreactor de 5 MW desensamblado en módulos, desde… Continúa leyendo »
EVMbench: el nuevo termómetro para medir si los agentes de IA saben encontrar, arreglar y explotar fallos en smart contracts
Los contratos inteligentes son como máquinas expendedoras que viven en una blockchain: metes una condición y, si se cumple, sueltan el resultado sin pedir permiso a nadie. El problema es que, cuando esa máquina custodia valor real, un tornillo mal puesto puede convertirse en una puerta trasera. OpenAI recuerda que estos contratos llegan a proteger más de 100.000 millones de dólares en activos cripto de código abierto, una cifra que explica por qué la seguridad de smart contracts se ha vuelto un deporte de alto riesgo.
En paralelo, los agentes de IA han mejorado mucho leyendo y escribiendo código, y también ejecutándolo. Si una IA puede revisar un repositorio como lo haría un auditor, también puede comportarse como un atacante paciente que prueba combinaciones hasta dar con la que drena fondos. El punto de OpenAI y Paradigm es directo: si el “nivel” de las máquinas sube, conviene medirlo en un entorno donde los errores se pagan caros. Continúa leyendo «EVMbench: el nuevo termómetro para medir si los agentes de IA saben encontrar, arreglar y explotar fallos en smart contracts»