OpenAI y Paradigm han presentado EVMbench, un nuevo marco de referencia diseñado para evaluar la capacidad de los agentes de IA para detectar, corregir y explotar las vulnerabilidades de las cadenas de bloques.
OpenAI y Paradigm lanzan EVMbench para medir la seguridad de los contratos inteligentes de IA

OpenAI y Paradigm han lanzado oficialmente EVMbench para abordar los riesgos de seguridad en los contratos inteligentes que protegen más de 100 000 millones de dólares en criptoactivos. El marco de referencia utiliza 120 vulnerabilidades seleccionadas de 40 auditorías profesionales, incluidos escenarios de la cadena de bloques Tempo, para poner a prueba las capacidades de la inteligencia artificial (IA) en un entorno de máquina virtual Ethereum (EVM) aislado.
El sistema evalúa a los agentes en tres modos distintos: detección de vulnerabilidades, parcheo funcional del código y ejecución de extremo a extremo de exploits para drenar fondos. Las pruebas recientes muestran que el modelo GPT-5.3-Codex alcanza una tasa de éxito del 72,2 % en tareas de explotación, lo que supone un aumento significativo con respecto a la puntuación del 31,9 % registrada por GPT-5 hace solo seis meses.
«Medir la capacidad del modelo en este ámbito ayuda a rastrear los riesgos cibernéticos emergentes y destaca la importancia de utilizar los sistemas de IA de forma defensiva para auditar y reforzar los contratos desplegados», según el anuncio de OpenAI.

Informe: Blockchain Tempo de Stripe y Paradigm Asegura $500M de Respaldo de Thrive, Greenoaks
Descubra el impacto del respaldo de Stripe mientras Tempo cierra su ronda de Serie A de $500 millones para mejorar la infraestructura de pagos blockchain. read more.
Leer ahora
Informe: Blockchain Tempo de Stripe y Paradigm Asegura $500M de Respaldo de Thrive, Greenoaks
Descubra el impacto del respaldo de Stripe mientras Tempo cierra su ronda de Serie A de $500 millones para mejorar la infraestructura de pagos blockchain. read more.
Leer ahora
Informe: Blockchain Tempo de Stripe y Paradigm Asegura $500M de Respaldo de Thrive, Greenoaks
Leer ahoraDescubra el impacto del respaldo de Stripe mientras Tempo cierra su ronda de Serie A de $500 millones para mejorar la infraestructura de pagos blockchain. read more.
🧭 Preguntas frecuentes
• ¿Cuál es el objetivo principal del marco EVMbench? Mide la eficacia con la que los agentes de IA identifican y resuelven las vulnerabilidades de alta gravedad de los contratos inteligentes.
• ¿Qué organizaciones colaboraron en el desarrollo de este nuevo punto de referencia de seguridad? OpenAI y la empresa de inversión en criptomonedas Paradigm desarrollaron conjuntamente el entorno de pruebas EVMbench.
• ¿Cómo verifica el sistema si un agente corrige correctamente el código? Las pruebas automatizadas garantizan que se eliminen las vulnerabilidades sin romper la lógica funcional prevista del contrato.
• ¿Existe apoyo financiero para los investigadores que utilizan estas herramientas? OpenAI está destinando 10 millones de dólares en créditos API para apoyar la investigación defensiva en materia de ciberseguridad.
Etiquetas en esta historia
Selecciones de Juegos de Bitcoin
425% hasta 5 BTC + 100 Giros Gratis














