Impulsado por
News Bytes

OpenAI y Paradigm lanzan EVMbench para medir la seguridad de los contratos inteligentes de IA

OpenAI y Paradigm han presentado EVMbench, un nuevo marco de referencia diseñado para evaluar la capacidad de los agentes de IA para detectar, corregir y explotar las vulnerabilidades de las cadenas de bloques.

ESCRITO POR
COMPARTIR
OpenAI y Paradigm lanzan EVMbench para medir la seguridad de los contratos inteligentes de IA

OpenAI y Paradigm han lanzado oficialmente EVMbench para abordar los riesgos de seguridad en los contratos inteligentes que protegen más de 100 000 millones de dólares en criptoactivos. El marco de referencia utiliza 120 vulnerabilidades seleccionadas de 40 auditorías profesionales, incluidos escenarios de la cadena de bloques Tempo, para poner a prueba las capacidades de la inteligencia artificial (IA) en un entorno de máquina virtual Ethereum (EVM) aislado.

El sistema evalúa a los agentes en tres modos distintos: detección de vulnerabilidades, parcheo funcional del código y ejecución de extremo a extremo de exploits para drenar fondos. Las pruebas recientes muestran que el modelo GPT-5.3-Codex alcanza una tasa de éxito del 72,2 % en tareas de explotación, lo que supone un aumento significativo con respecto a la puntuación del 31,9 % registrada por GPT-5 hace solo seis meses.

«Medir la capacidad del modelo en este ámbito ayuda a rastrear los riesgos cibernéticos emergentes y destaca la importancia de utilizar los sistemas de IA de forma defensiva para auditar y reforzar los contratos desplegados», según el anuncio de OpenAI.

Informe: Blockchain Tempo de Stripe y Paradigm Asegura $500M de Respaldo de Thrive, Greenoaks

Informe: Blockchain Tempo de Stripe y Paradigm Asegura $500M de Respaldo de Thrive, Greenoaks

Descubra el impacto del respaldo de Stripe mientras Tempo cierra su ronda de Serie A de $500 millones para mejorar la infraestructura de pagos blockchain. read more.

Leer ahora

🧭 Preguntas frecuentes

¿Cuál es el objetivo principal del marco EVMbench? Mide la eficacia con la que los agentes de IA identifican y resuelven las vulnerabilidades de alta gravedad de los contratos inteligentes.

¿Qué organizaciones colaboraron en el desarrollo de este nuevo punto de referencia de seguridad? OpenAI y la empresa de inversión en criptomonedas Paradigm desarrollaron conjuntamente el entorno de pruebas EVMbench.

¿Cómo verifica el sistema si un agente corrige correctamente el código? Las pruebas automatizadas garantizan que se eliminen las vulnerabilidades sin romper la lógica funcional prevista del contrato.

¿Existe apoyo financiero para los investigadores que utilizan estas herramientas? OpenAI está destinando 10 millones de dólares en créditos API para apoyar la investigación defensiva en materia de ciberseguridad.

Selecciones de Juegos de Bitcoin

100% de Bono hasta 1 BTC + 10% de Reembolso Semanal sin Apuesta

100% de Bono Hasta 1 BTC + 10% de Reembolso Semanal

130% hasta 2,500 USDT + 200 Giros Gratis + 20% de Reembolso Semanal sin Apuesta

1000% de Bono de Bienvenida + Apuesta Gratis hasta 1 BTC

Hasta 2,500 USDT + 150 Giros Gratis + Hasta 30% de Reembolso

470% de Bono hasta $500,000 + 400 Giros Gratis + 20% de Reembolso

3.5% de Reembolso en Cada Apuesta + Sorteos Semanales

425% hasta 5 BTC + 100 Giros Gratis

100% hasta $20K + Reembolso Diario