Az OpenAI és a Paradigm bemutatta az EVMbench-et, egy új benchmark keretrendszert, amelyet arra terveztek, hogy értékelje az MI-ügynökök képességét a blokklánc-sebezhetőségek felismerésére, javítására és kihasználására.
Az OpenAI és a Paradigm elindítja az EVMbench-et az MI-alapú okosszerződés-biztonság mérésére

Az OpenAI és a Paradigm hivatalosan elindította az EVMbench-et, hogy kezelje az okosszerződésekben rejlő biztonsági kockázatokat, amelyek több mint 100 milliárd dollárnyi kriptoeszközt védenek. A benchmark 40 professzionális auditból származó, gondosan válogatott 120 sebezhetőséget használ, köztük a Tempo blokkláncból vett forgatókönyveket, hogy egy izolált Ethereum Virtual Machine (EVM) környezetben tesztelje a mesterséges intelligencia (MI) képességeit.
A rendszer három különálló módban értékeli az ügynököket: a sebezhetőségek észlelése, a kód funkcionális javítása, valamint a pénzelszívó exploitok teljes, elejétől a végéig történő végrehajtása. A legutóbbi tesztek azt mutatják, hogy a GPT-5.3-Codex modell 72,2%-os sikerarányt ér el az exploit feladatokban, ami jelentős növekedés a mindössze hat hónappal ezelőtt a GPT-5 által elért 31,9%-os eredményhez képest.
„A modellek képességének mérése ezen a területen segít nyomon követni a feltörekvő kiberkockázatokat, és rávilágít annak fontosságára, hogy az MI-rendszereket védekező módon használjuk a telepített szerződések auditálására és megerősítésére” – áll az OpenAI bejelentésében.

Jelentés: A Stripe és Paradigm Blockchain Tempo-ja 500 millió dolláros támogatást kapott a Thrive-tól és a Greenoaks-tól
Ismerje meg a Stripe támogatásának hatását, amint a Tempo lezárja a 500 millió dolláros Series A kört a blokklánc fizetési infrastruktúra fejlesztése érdekében. read more.
Olvass most
Jelentés: A Stripe és Paradigm Blockchain Tempo-ja 500 millió dolláros támogatást kapott a Thrive-tól és a Greenoaks-tól
Ismerje meg a Stripe támogatásának hatását, amint a Tempo lezárja a 500 millió dolláros Series A kört a blokklánc fizetési infrastruktúra fejlesztése érdekében. read more.
Olvass most
Jelentés: A Stripe és Paradigm Blockchain Tempo-ja 500 millió dolláros támogatást kapott a Thrive-tól és a Greenoaks-tól
Olvass mostIsmerje meg a Stripe támogatásának hatását, amint a Tempo lezárja a 500 millió dolláros Series A kört a blokklánc fizetési infrastruktúra fejlesztése érdekében. read more.
🧭 GYIK
• Mi az EVMbench keretrendszer elsődleges célja? Azt méri, hogy az MI-ügynökök milyen hatékonyan azonosítják és oldják meg a nagy súlyosságú okosszerződés-sebezhetőségeket.
• Mely szervezetek működtek együtt ennek az új biztonsági benchmarknak a fejlesztésében? Az OpenAI és a Paradigm kriptobefektetési cég közösen fejlesztette ki az EVMbench tesztkörnyezetet.
• Hogyan ellenőrzi a rendszer, hogy egy ügynök sikeresen javította-e a kódot? Automatizált tesztek biztosítják, hogy a sebezhetőségek megszűnjenek anélkül, hogy sérülne a szerződés rendeltetésszerű működési logikája.
• Elérhető pénzügyi támogatás a kutatók számára ezen eszközök használatához? Az OpenAI 10 millió dollárnyi API-kreditet biztosít a védekező kiberbiztonsági kutatások támogatására.














