提供
News Bytes

OpenAIとParadigm、AIスマートコントラクトのセキュリティを測定する「EVMbench」を発表

OpenAIとParadigmは、AIエージェントがブロックチェーンの脆弱性を検出、修正、悪用する能力を評価するために設計された新たなベンチマークフレームワーク「EVMbench」を発表した。

共有
OpenAIとParadigm、AIスマートコントラクトのセキュリティを測定する「EVMbench」を発表

OpenAIとParadigmは、1,000億ドル以上の暗号資産を保護するスマートコントラクトのセキュリティリスクに対処するため、EVMbenchを正式にリリースした。このベンチマークは、Tempoブロックチェーンのシナリオを含む40件のプロフェッショナル監査から厳選された120の脆弱性を利用し、サンドボックス化されたイーサリアム仮想マシン(EVM)環境における人工知能(AI)の能力をテストする。

本システムは3つのモードでエージェントを評価する:脆弱性検出、コードの機能的パッチ適用、資金流出型エクスプロイトのエンドツーエンド実行。最近のテストでは、GPT-5.3-Codexモデルがエクスプロイトタスクで72.2%の成功率を達成。これはわずか6か月前のGPT-5の31.9%から大幅な向上を示す。

OpenAIの発表によれば、「この領域におけるモデル能力の測定は、新たなサイバーリスクの追跡に役立ち、展開済み契約の監査と強化のために防御的にAIシステムを活用することの重要性を浮き彫りにする」とのことです。

レポート: StripeとParadigmのブロックチェーンTempoがThriveおよびGreenoaksから5億ドルの支援を確保

レポート: StripeとParadigmのブロックチェーンTempoがThriveおよびGreenoaksから5億ドルの支援を確保

Stripe の支援によって Tempo が 5 億ドルのシリーズ A ラウンドを完了し、ブロックチェーン支払いインフラストラクチャを強化する影響を発見してください。 read more.

今すぐ読む

🧭 よくある質問

EVMbenchフレームワークの主な目的は? AIエージェントが深刻度の高いスマートコントラクト脆弱性をどれだけ効果的に特定・解決できるかを測定することです。

この新たなセキュリティベンチマーク開発にはどの組織が協力しましたか? OpenAIと暗号資産投資会社Paradigmが共同でEVMbenchテスト環境を開発しました。

エージェントがコードのパッチ適用に成功したかどうかをシステムはどのように検証しますか?自動化されたテストにより、契約の意図した機能ロジックを損なうことなく脆弱性が排除されていることを保証します。

これらのツールを利用する研究者向けの資金支援はありますか?OpenAIは防御的サイバーセキュリティ研究を支援するため、1,000万ドル相当のAPIクレジットを提供します。