OpenAI与Paradigm联合推出EVMbench——一款全新基准测试框架,旨在评估人工智能代理检测、修复及利用区块链漏洞的能力。
OpenAI与Paradigm联合推出EVMbench平台,用于评估人工智能智能合约安全性

OpenAI与Paradigm正式推出EVMbench,旨在解决智能合约中的安全风险——这些合约守护着价值逾千亿美元的加密资产。该基准测试框架整合了来自40次专业审计的120个精选漏洞(包括Tempo区块链场景),在沙盒化的以太坊虚拟机(EVM)环境中测试人工智能(AI)能力。
该系统通过三大模式评估智能体:漏洞检测、代码功能性修复以及端到端资金转移漏洞利用。最新测试显示,GPT-5.3-Codex模型在漏洞利用任务中达成72.2%的成功率,较六个月前GPT-5的31.9%成绩实现显著提升。
OpenAI公告指出:"衡量该领域模型能力有助于追踪新兴网络风险,并凸显了防御性运用AI系统审计和强化部署合约的重要性。"

报告:Stripe和Paradigm的区块链Tempo获得Thrive和Greenoaks的5亿美元支持
了解Stripe的支持对Tempo以5亿美元完成A轮融资以增强区块链支付基础设施的影响。 read more.
立即阅读
报告:Stripe和Paradigm的区块链Tempo获得Thrive和Greenoaks的5亿美元支持
了解Stripe的支持对Tempo以5亿美元完成A轮融资以增强区块链支付基础设施的影响。 read more.
立即阅读
报告:Stripe和Paradigm的区块链Tempo获得Thrive和Greenoaks的5亿美元支持
立即阅读了解Stripe的支持对Tempo以5亿美元完成A轮融资以增强区块链支付基础设施的影响。 read more.
🧭 常见问题
• EVMbench框架的主要目的?该框架用于评估AI代理识别并解决高危智能合约漏洞的效能。
• 哪些机构合作开发了这项新安全基准?OpenAI与加密投资公司Paradigm共同开发了EVMbench测试环境。
• 系统如何验证智能体是否成功修复代码?自动化测试确保漏洞消除不会破坏合约预期的功能逻辑。
• 使用这些工具的研究人员能否获得资金支持?OpenAI将提供1000万美元API积分,用于支持防御性网络安全研究。














