Pinapagana ng
News Bytes

Inilunsad ng OpenAI at Paradigm ang EVMbench upang Sukatin ang Seguridad ng Smart Contract ng AI

Ipinakilala ng OpenAI at Paradigm ang EVMbench, isang bagong benchmarking framework na idinisenyo upang suriin ang kakayahan ng mga AI agent na matukoy, ayusin, at pagsamantalahan ang mga kahinaan sa blockchain.

ISINULAT NI
IBAHAGI
Inilunsad ng OpenAI at Paradigm ang EVMbench upang Sukatin ang Seguridad ng Smart Contract ng AI

Opisyal na inilunsad ng OpenAI at Paradigm ang EVMbench upang tugunan ang mga panganib sa seguridad sa mga smart contract na nagpoprotekta sa mahigit $100 bilyon na crypto assets. Gumagamit ang benchmark ng 120 piniling mga kahinaan mula sa 40 propesyonal na audit, kabilang ang mga senaryo mula sa Tempo blockchain, upang subukan ang mga kakayahan ng Artificial Intelligence (AI) sa isang sandboxed na Ethereum Virtual Machine (EVM) environment.

Sinusuri ng sistema ang mga agent sa tatlong magkakaibang mode: pagtukoy ng mga kahinaan, functional na pagpa-patch ng code, at end-to-end na pagpatupad ng mga exploit na nagda-drain ng pondo. Ipinapakita ng mga kamakailang pagsusuri na ang modelong GPT-5.3-Codex ay nakakamit ang 72.2% na success rate sa mga exploit task, na isang malaking pagtaas mula sa 31.9% na iskor na naitala ng GPT-5 anim na buwan pa lamang ang nakalipas.

“Ang pagsukat ng kakayahan ng modelo sa larangang ito ay nakakatulong na subaybayan ang mga umuusbong na cyber risk at binibigyang-diin ang kahalagahan ng paggamit ng mga AI system sa depensibong paraan upang i-audit at palakasin ang mga na-deploy na kontrata,” ayon sa anunsyo ng OpenAI.

Ulat: Nakakuha ang Blockchain Tempo ni Stripe at Paradigm ng $500M Suporta Mula sa Thrive, Greenoaks

Ulat: Nakakuha ang Blockchain Tempo ni Stripe at Paradigm ng $500M Suporta Mula sa Thrive, Greenoaks

Tuklasin ang epekto ng suporta ng Stripe habang natapos ng Tempo ang $500 milyong Series A round nito upang pahusayin ang imprastraktura ng pagbabayad sa blockchain. read more.

Basahin ngayon

🧭 Mga FAQ

Ano ang pangunahing layunin ng EVMbench framework? Sinusukat nito kung gaano kaepektibo ang mga AI agent sa pagtukoy at paglutas ng mga smart contract vulnerability na may mataas na antas ng kalubhaan.

Aling mga organisasyon ang nagtulungan upang mabuo ang bagong security benchmark na ito? Magkasamang binuo ng OpenAI at ng crypto investment firm na Paradigm ang EVMbench testing environment.

Paano bine-verify ng sistema kung matagumpay na na-patch ng isang agent ang code? Tinitiyak ng mga automated test na natanggal ang mga kahinaan nang hindi nasisira ang nilalayong functional logic ng kontrata.

Mayroon bang pinansyal na suporta na available para sa mga mananaliksik na gumagamit ng mga tool na ito? Naglalaan ang OpenAI ng $10 milyon sa API credits upang suportahan ang depensibong pananaliksik sa cybersecurity.