OpenAI in Paradigm sta predstavila EVMbench, nov okvir za primerjalno testiranje, zasnovan za ocenjevanje sposobnosti agentov umetne inteligence pri odkrivanju, popravljanju in izkoriščanju ranljivosti v verigah blokov.
OpenAI in Paradigm lansirata EVMbench za merjenje varnosti pametnih pogodb z umetno inteligenco

OpenAI in Paradigm sta uradno zagnala EVMbench, da bi naslovila varnostna tveganja v pametnih pogodbah, ki varujejo več kot 100 milijard dolarjev kripto sredstev. Merilo uporablja 120 skrbno izbranih ranljivosti iz 40 profesionalnih revizij, vključno s scenariji iz verige blokov Tempo, za preizkus zmogljivosti umetne inteligence (AI) v peskovniškem okolju Ethereum Virtual Machine (EVM).
Sistem ocenjuje agente v treh ločenih načinih: odkrivanje ranljivosti, funkcionalno popravljanje kode ter izvedba izkoriščanj od začetka do konca, ki izpraznijo sredstva. Nedavno testiranje kaže, da model GPT-5.3-Codex pri nalogah izkoriščanja dosega 72,2-odstotno stopnjo uspešnosti, kar pomeni znatno povečanje v primerjavi z rezultatom 31,9 %, ki ga je GPT-5 dosegel pred zgolj šestimi meseci.
»Merjenje zmogljivosti modelov na tem področju pomaga spremljati nastajajoča kibernetska tveganja in poudarja pomen uporabe sistemov AI v obrambne namene za revizijo in krepitev že uvedenih pogodb,« navaja OpenAI v objavi.

Poročilo: Stripe in Paradigmova Blockchain Tempo zagotavlja 500 milijonov dolarjev podpore od Thrive, Greenoaks
Odkrijte vpliv podpore Stripe, saj je Tempo zaključil svoj krog financiranja serije A v višini 500 milijonov dolarjev za izboljšanje plačilne infrastrukture veriženja blokov. read more.
Preberi zdaj
Poročilo: Stripe in Paradigmova Blockchain Tempo zagotavlja 500 milijonov dolarjev podpore od Thrive, Greenoaks
Odkrijte vpliv podpore Stripe, saj je Tempo zaključil svoj krog financiranja serije A v višini 500 milijonov dolarjev za izboljšanje plačilne infrastrukture veriženja blokov. read more.
Preberi zdaj
Poročilo: Stripe in Paradigmova Blockchain Tempo zagotavlja 500 milijonov dolarjev podpore od Thrive, Greenoaks
Preberi zdajOdkrijte vpliv podpore Stripe, saj je Tempo zaključil svoj krog financiranja serije A v višini 500 milijonov dolarjev za izboljšanje plačilne infrastrukture veriženja blokov. read more.
🧭 Pogosta vprašanja
• Kakšen je glavni namen ogrodja EVMbench? Meri, kako učinkovito agenti umetne inteligence prepoznajo in odpravijo visoko kritične ranljivosti pametnih pogodb.
• Katere organizacije so sodelovale pri razvoju tega novega varnostnega merila? OpenAI in kripto investicijsko podjetje Paradigm sta skupaj razvila testno okolje EVMbench.
• Kako sistem preveri, ali agent uspešno popravi kodo? Avtomatizirani testi zagotovijo, da so ranljivosti odpravljene, ne da bi pri tem porušili predvideno funkcionalno logiko pogodbe.
• Ali je na voljo finančna podpora za raziskovalce, ki uporabljajo ta orodja? OpenAI namenja 10 milijonov dolarjev v obliki API kreditov za podporo obrambnim kibernetsko-varnostnim raziskavam.













