OpenAI og Paradigm har introdusert EVMbench, et nytt benchmark-rammeverk utviklet for å evaluere AI-agenters evne til å oppdage, utbedre og utnytte sårbarheter i blokkjeder.
OpenAI og Paradigm lanserer EVMbench for å måle sikkerheten til AI-smartkontrakter

OpenAI og Paradigm lanserte offisielt EVMbench for å håndtere sikkerhetsrisikoer i smarte kontrakter som sikrer over 100 milliarder dollar i kryptoaktiva. Benchmarket bruker 120 kuraterte sårbarheter fra 40 profesjonelle revisjoner, inkludert scenarier fra Tempo-blokkjeden, for å teste kunstig intelligens (AI)-kapasiteter i et sandkasset Ethereum Virtual Machine (EVM)-miljø.
Systemet evaluerer agenter i tre ulike moduser: oppdagelse av sårbarheter, funksjonell utbedring av kode og ende-til-ende gjennomføring av exploits som tapper midler. Nylig testing viser at modellen GPT-5.3-Codex oppnår en suksessrate på 72,2 % i exploit-oppgaver, noe som markerer en betydelig økning fra 31,9 %-scoren registrert av GPT-5 for bare seks måneder siden.
«Å måle modellkapabilitet i dette domenet bidrar til å spore fremvoksende cyberrisikoer og fremhever viktigheten av å bruke AI-systemer defensivt for å revidere og styrke kontrakter som allerede er i bruk», ifølge OpenAI-kunngjøringen.

Rapport: Stripe og Paradigm’s Blockchain Tempo sikrer $500M støtte fra Thrive, Greenoaks
Oppdag virkningen av Stripes støtte når Tempo avslutter sin Serie A-runde på 500 millioner dollar for å forbedre blokkjedebetalingsinfrastrukturen. read more.
Les nå
Rapport: Stripe og Paradigm’s Blockchain Tempo sikrer $500M støtte fra Thrive, Greenoaks
Oppdag virkningen av Stripes støtte når Tempo avslutter sin Serie A-runde på 500 millioner dollar for å forbedre blokkjedebetalingsinfrastrukturen. read more.
Les nå
Rapport: Stripe og Paradigm’s Blockchain Tempo sikrer $500M støtte fra Thrive, Greenoaks
Les nåOppdag virkningen av Stripes støtte når Tempo avslutter sin Serie A-runde på 500 millioner dollar for å forbedre blokkjedebetalingsinfrastrukturen. read more.
🧭 Vanlige spørsmål
• Hva er hovedformålet med EVMbench-rammeverket? Det måler hvor effektivt AI-agenter identifiserer og løser smarte kontraktsårbarheter med høy alvorlighetsgrad.
• Hvilke organisasjoner samarbeidet om å utvikle dette nye sikkerhetsbenchmarket? OpenAI og kryptoinvesteringsselskapet Paradigm utviklet EVMbench-testmiljøet sammen.
• Hvordan verifiserer systemet om en agent lykkes med å utbedre kode? Automatiserte tester sikrer at sårbarheter elimineres uten å ødelegge kontraktens tiltenkte funksjonelle logikk.
• Finnes det økonomisk støtte tilgjengelig for forskere som bruker disse verktøyene? OpenAI forplikter seg til 10 millioner dollar i API-kreditter for å støtte defensiv cybersikkerhetsforskning.
Tags i denne artikkelen
Bitcoin spillvalg
425% opp til 5 BTC + 100 Gratisspinn















