Didukung oleh
News Bytes

OpenAI dan Paradigm meluncurkan EVMbench untuk mengukur keamanan kontrak pintar AI.

OpenAI dan Paradigm telah memperkenalkan EVMbench, sebuah kerangka kerja pengujian kinerja baru yang dirancang untuk mengevaluasi kemampuan agen kecerdasan buatan (AI) dalam mendeteksi, memperbaiki, dan memanipulasi kerentanan blockchain.

DITULIS OLEH
BAGIKAN
OpenAI dan Paradigm meluncurkan EVMbench untuk mengukur keamanan kontrak pintar AI.

OpenAI dan Paradigm secara resmi meluncurkan EVMbench untuk mengatasi risiko keamanan dalam kontrak pintar yang melindungi aset kripto senilai lebih dari $100 miliar. Kerangka kerja ini menggunakan 120 kerentanan yang telah diseleksi dari 40 audit profesional, termasuk skenario dari blockchain Tempo, untuk menguji kemampuan kecerdasan buatan (AI) dalam lingkungan Ethereum Virtual Machine (EVM) yang terisolasi.

Sistem ini mengevaluasi agen melalui tiga mode yang berbeda: deteksi kerentanan, perbaikan kode fungsional, dan eksekusi end-to-end eksploitasi yang menguras dana. Pengujian terbaru menunjukkan bahwa model GPT-5.3-Codex mencapai tingkat keberhasilan 72,2% dalam tugas eksploitasi, meningkat signifikan dari skor 31,9% yang dicatat oleh GPT-5 enam bulan lalu.

“Mengukur kemampuan model dalam domain ini membantu melacak risiko siber yang muncul dan menyoroti pentingnya menggunakan sistem AI secara defensif untuk mengaudit dan memperkuat kontrak yang telah diimplementasikan,” menurut pengumuman OpenAI.

Laporan: Tempo Blockchain Stripe dan Paradigm Mengamankan Dukungan $500 Juta Dari Thrive, Greenoaks

Laporan: Tempo Blockchain Stripe dan Paradigm Mengamankan Dukungan $500 Juta Dari Thrive, Greenoaks

Temukan dampak dukungan Stripe saat Tempo menutup pendanaan Seri A sebesar $500 juta untuk meningkatkan infrastruktur pembayaran blockchain. read more.

Baca sekarang

🧭 FAQs

Apa tujuan utama kerangka kerja EVMbench? Kerangka kerja ini mengukur seberapa efektif agen AI mengidentifikasi dan menyelesaikan kerentanan kontrak pintar berisiko tinggi.

Organisasi mana yang berkolaborasi dalam mengembangkan tolok ukur keamanan baru ini? OpenAI dan firma investasi kripto Paradigm bersama-sama mengembangkan lingkungan pengujian EVMbench.

Bagaimana sistem memverifikasi apakah agen berhasil memperbaiki kode? Uji otomatis memastikan kerentanan dihilangkan tanpa merusak logika fungsional yang dimaksudkan kontrak.

Apakah ada dukungan finansial tersedia untuk peneliti yang menggunakan alat-alat ini? OpenAI berkomitmen menyediakan $10 juta dalam bentuk kredit API untuk mendukung penelitian keamanan siber defensif.