OpenAI og Paradigm har introduceret EVMbench, et nyt benchmarking-framework, der er designet til at evaluere AI-agenters evne til at opdage, udbedre og udnytte blockchain-sårbarheder.
OpenAI og Paradigm lancerer EVMbench til at måle AI-sikkerhed i smarte kontrakter

OpenAI og Paradigm lancerede officielt EVMbench for at imødegå sikkerhedsrisici i smart contracts, der sikrer over 100 milliarder dollars i kryptoaktiver. Benchmarket anvender 120 kuraterede sårbarheder fra 40 professionelle audits, herunder scenarier fra Tempo-blockchainen, til at teste Artificial Intelligence (AI)-kapaciteter i et sandkasset (sandboxed) Ethereum Virtual Machine (EVM)-miljø.
Systemet evaluerer agenter på tværs af tre adskilte tilstande: detektion af sårbarheder, funktionel udbedring af kode og end-to-end-udførelse af udnyttelser, der tømmer midler. Nylige tests viser, at modellen GPT-5.3-Codex opnår en succesrate på 72,2 % i exploit-opgaver, hvilket markerer en betydelig stigning fra den score på 31,9 %, som GPT-5 registrerede for blot seks måneder siden.
“At måle modelkapabilitet inden for dette domæne hjælper med at spore nye cyberrisici og fremhæver vigtigheden af at bruge AI-systemer defensivt til at revidere og styrke implementerede contracts,” ifølge OpenAI-meddelelsen.

Rapport: Stripe og Paradigm's Blockchain Tempo Sikrer $500M Støtte Fra Thrive, Greenoaks
Opdag virkningen af Stripes støtte, da Tempo afslutter sin $500 millioner Series A-runde for at forbedre blockchain-betalingsinfrastrukturen. read more.
Læs nu
Rapport: Stripe og Paradigm's Blockchain Tempo Sikrer $500M Støtte Fra Thrive, Greenoaks
Opdag virkningen af Stripes støtte, da Tempo afslutter sin $500 millioner Series A-runde for at forbedre blockchain-betalingsinfrastrukturen. read more.
Læs nu
Rapport: Stripe og Paradigm's Blockchain Tempo Sikrer $500M Støtte Fra Thrive, Greenoaks
Læs nuOpdag virkningen af Stripes støtte, da Tempo afslutter sin $500 millioner Series A-runde for at forbedre blockchain-betalingsinfrastrukturen. read more.
🧭 Ofte stillede spørgsmål
• Hvad er det primære formål med EVMbench-frameworket? Det måler, hvor effektivt AI-agenter identificerer og afhjælper smart contract-sårbarheder med høj alvorlighed.
• Hvilke organisationer samarbejdede om at udvikle dette nye sikkerhedsbenchmark? OpenAI og krypto-investeringsfirmaet Paradigm udviklede i fællesskab EVMbench-testmiljøet.
• Hvordan verificerer systemet, om en agent har udbedret kode med succes? Automatiserede tests sikrer, at sårbarheder elimineres uden at bryde kontraktens tilsigtede funktionelle logik.
• Er der økonomisk støtte tilgængelig for forskere, der bruger disse værktøjer? OpenAI forpligter 10 millioner dollars i API-kreditter til at støtte defensiv cybersikkerhedsforskning.
Tags i denne artikel
Bitcoin Gaming Picks
425% op til 5 BTC + 100 Gratis Spins














