Durante años, la idea dominante de la inteligencia artificial de consumo fue la del asistente conversacional: tú preguntas, el sistema responde. En 2025 y 2026 esa imagen se ha quedado corta porque han proliferado los agentes de IA, herramientas que no solo contestan, sino que ejecutan tareas encadenadas con poca intervención humana: buscar información, abrir… Continúa leyendo »
EVMbench: el nuevo termómetro para medir si los agentes de IA saben encontrar, arreglar y explotar fallos en smart contracts
Los contratos inteligentes son como máquinas expendedoras que viven en una blockchain: metes una condición y, si se cumple, sueltan el resultado sin pedir permiso a nadie. El problema es que, cuando esa máquina custodia valor real, un tornillo mal puesto puede convertirse en una puerta trasera. OpenAI recuerda que estos contratos llegan a proteger más de 100.000 millones de dólares en activos cripto de código abierto, una cifra que explica por qué la seguridad de smart contracts se ha vuelto un deporte de alto riesgo.
En paralelo, los agentes de IA han mejorado mucho leyendo y escribiendo código, y también ejecutándolo. Si una IA puede revisar un repositorio como lo haría un auditor, también puede comportarse como un atacante paciente que prueba combinaciones hasta dar con la que drena fondos. El punto de OpenAI y Paradigm es directo: si el “nivel” de las máquinas sube, conviene medirlo en un entorno donde los errores se pagan caros. Continúa leyendo «EVMbench: el nuevo termómetro para medir si los agentes de IA saben encontrar, arreglar y explotar fallos en smart contracts»