Poganja
News Bytes

OpenAI in Paradigm lansirata EVMbench za merjenje varnosti pametnih pogodb z umetno inteligenco

OpenAI in Paradigm sta predstavila EVMbench, nov okvir za primerjalno testiranje, zasnovan za ocenjevanje sposobnosti agentov umetne inteligence pri odkrivanju, popravljanju in izkoriščanju ranljivosti v verigah blokov.

DELI
OpenAI in Paradigm lansirata EVMbench za merjenje varnosti pametnih pogodb z umetno inteligenco

OpenAI in Paradigm sta uradno zagnala EVMbench, da bi naslovila varnostna tveganja v pametnih pogodbah, ki varujejo več kot 100 milijard dolarjev kripto sredstev. Merilo uporablja 120 skrbno izbranih ranljivosti iz 40 profesionalnih revizij, vključno s scenariji iz verige blokov Tempo, za preizkus zmogljivosti umetne inteligence (AI) v peskovniškem okolju Ethereum Virtual Machine (EVM).

Sistem ocenjuje agente v treh ločenih načinih: odkrivanje ranljivosti, funkcionalno popravljanje kode ter izvedba izkoriščanj od začetka do konca, ki izpraznijo sredstva. Nedavno testiranje kaže, da model GPT-5.3-Codex pri nalogah izkoriščanja dosega 72,2-odstotno stopnjo uspešnosti, kar pomeni znatno povečanje v primerjavi z rezultatom 31,9 %, ki ga je GPT-5 dosegel pred zgolj šestimi meseci.

»Merjenje zmogljivosti modelov na tem področju pomaga spremljati nastajajoča kibernetska tveganja in poudarja pomen uporabe sistemov AI v obrambne namene za revizijo in krepitev že uvedenih pogodb,« navaja OpenAI v objavi.

Poročilo: Stripe in Paradigmova Blockchain Tempo zagotavlja 500 milijonov dolarjev podpore od Thrive, Greenoaks

Poročilo: Stripe in Paradigmova Blockchain Tempo zagotavlja 500 milijonov dolarjev podpore od Thrive, Greenoaks

Odkrijte vpliv podpore Stripe, saj je Tempo zaključil svoj krog financiranja serije A v višini 500 milijonov dolarjev za izboljšanje plačilne infrastrukture veriženja blokov. read more.

Preberi zdaj

🧭 Pogosta vprašanja

Kakšen je glavni namen ogrodja EVMbench? Meri, kako učinkovito agenti umetne inteligence prepoznajo in odpravijo visoko kritične ranljivosti pametnih pogodb.

Katere organizacije so sodelovale pri razvoju tega novega varnostnega merila? OpenAI in kripto investicijsko podjetje Paradigm sta skupaj razvila testno okolje EVMbench.

Kako sistem preveri, ali agent uspešno popravi kodo? Avtomatizirani testi zagotovijo, da so ranljivosti odpravljene, ne da bi pri tem porušili predvideno funkcionalno logiko pogodbe.

Ali je na voljo finančna podpora za raziskovalce, ki uporabljajo ta orodja? OpenAI namenja 10 milijonov dolarjev v obliki API kreditov za podporo obrambnim kibernetsko-varnostnim raziskavam.