Drevet af
News Bytes

OpenAI og Paradigm lancerer EVMbench til at måle AI-sikkerhed i smarte kontrakter

OpenAI og Paradigm har introduceret EVMbench, et nyt benchmarking-framework, der er designet til at evaluere AI-agenters evne til at opdage, udbedre og udnytte blockchain-sårbarheder.

SKREVET AF
DEL
OpenAI og Paradigm lancerer EVMbench til at måle AI-sikkerhed i smarte kontrakter

OpenAI og Paradigm lancerede officielt EVMbench for at imødegå sikkerhedsrisici i smart contracts, der sikrer over 100 milliarder dollars i kryptoaktiver. Benchmarket anvender 120 kuraterede sårbarheder fra 40 professionelle audits, herunder scenarier fra Tempo-blockchainen, til at teste Artificial Intelligence (AI)-kapaciteter i et sandkasset (sandboxed) Ethereum Virtual Machine (EVM)-miljø.

Systemet evaluerer agenter på tværs af tre adskilte tilstande: detektion af sårbarheder, funktionel udbedring af kode og end-to-end-udførelse af udnyttelser, der tømmer midler. Nylige tests viser, at modellen GPT-5.3-Codex opnår en succesrate på 72,2 % i exploit-opgaver, hvilket markerer en betydelig stigning fra den score på 31,9 %, som GPT-5 registrerede for blot seks måneder siden.

“At måle modelkapabilitet inden for dette domæne hjælper med at spore nye cyberrisici og fremhæver vigtigheden af at bruge AI-systemer defensivt til at revidere og styrke implementerede contracts,” ifølge OpenAI-meddelelsen.

Rapport: Stripe og Paradigm's Blockchain Tempo Sikrer $500M Støtte Fra Thrive, Greenoaks

Rapport: Stripe og Paradigm's Blockchain Tempo Sikrer $500M Støtte Fra Thrive, Greenoaks

Opdag virkningen af Stripes støtte, da Tempo afslutter sin $500 millioner Series A-runde for at forbedre blockchain-betalingsinfrastrukturen. read more.

Læs nu

🧭 Ofte stillede spørgsmål

Hvad er det primære formål med EVMbench-frameworket? Det måler, hvor effektivt AI-agenter identificerer og afhjælper smart contract-sårbarheder med høj alvorlighed.

Hvilke organisationer samarbejdede om at udvikle dette nye sikkerhedsbenchmark? OpenAI og krypto-investeringsfirmaet Paradigm udviklede i fællesskab EVMbench-testmiljøet.

Hvordan verificerer systemet, om en agent har udbedret kode med succes? Automatiserede tests sikrer, at sårbarheder elimineres uden at bryde kontraktens tilsigtede funktionelle logik.

Er der økonomisk støtte tilgængelig for forskere, der bruger disse værktøjer? OpenAI forpligter 10 millioner dollars i API-kreditter til at støtte defensiv cybersikkerhedsforskning.

Bitcoin Gaming Picks

100% Bonus op til 1 BTC + 10% Ugentlig Indsatsfri Cashback

100% Bonus Op Til 1 BTC + 10% Ugentlig Cashback

130% op til 2.500 USDT + 200 Gratis Spins + 20% Ugentlig Indsatsfri Cashback

1000% Velkomstbonus + Gratis Væddemål op til 1 BTC

Op til 2.500 USDT + 150 Gratis Spins + Op til 30% Rakeback

470% Bonus op til $500.000 + 400 Gratis Spins + 20% Rakeback

3,5% Rakeback på Hvert Væddemål + Ugentlige Lodtrækninger

425% op til 5 BTC + 100 Gratis Spins

100% op til $20K + Daglig Rakeback