Drevet av
News Bytes

OpenAI og Paradigm lanserer EVMbench for å måle sikkerheten til AI-smartkontrakter

OpenAI og Paradigm har introdusert EVMbench, et nytt benchmark-rammeverk utviklet for å evaluere AI-agenters evne til å oppdage, utbedre og utnytte sårbarheter i blokkjeder.

SKREVET AV
DEL
OpenAI og Paradigm lanserer EVMbench for å måle sikkerheten til AI-smartkontrakter

OpenAI og Paradigm lanserte offisielt EVMbench for å håndtere sikkerhetsrisikoer i smarte kontrakter som sikrer over 100 milliarder dollar i kryptoaktiva. Benchmarket bruker 120 kuraterte sårbarheter fra 40 profesjonelle revisjoner, inkludert scenarier fra Tempo-blokkjeden, for å teste kunstig intelligens (AI)-kapasiteter i et sandkasset Ethereum Virtual Machine (EVM)-miljø.

Systemet evaluerer agenter i tre ulike moduser: oppdagelse av sårbarheter, funksjonell utbedring av kode og ende-til-ende gjennomføring av exploits som tapper midler. Nylig testing viser at modellen GPT-5.3-Codex oppnår en suksessrate på 72,2 % i exploit-oppgaver, noe som markerer en betydelig økning fra 31,9 %-scoren registrert av GPT-5 for bare seks måneder siden.

«Å måle modellkapabilitet i dette domenet bidrar til å spore fremvoksende cyberrisikoer og fremhever viktigheten av å bruke AI-systemer defensivt for å revidere og styrke kontrakter som allerede er i bruk», ifølge OpenAI-kunngjøringen.

Rapport: Stripe og Paradigm’s Blockchain Tempo sikrer $500M støtte fra Thrive, Greenoaks

Rapport: Stripe og Paradigm’s Blockchain Tempo sikrer $500M støtte fra Thrive, Greenoaks

Oppdag virkningen av Stripes støtte når Tempo avslutter sin Serie A-runde på 500 millioner dollar for å forbedre blokkjedebetalingsinfrastrukturen. read more.

Les nå

🧭 Vanlige spørsmål

Hva er hovedformålet med EVMbench-rammeverket? Det måler hvor effektivt AI-agenter identifiserer og løser smarte kontraktsårbarheter med høy alvorlighetsgrad.

Hvilke organisasjoner samarbeidet om å utvikle dette nye sikkerhetsbenchmarket? OpenAI og kryptoinvesteringsselskapet Paradigm utviklet EVMbench-testmiljøet sammen.

Hvordan verifiserer systemet om en agent lykkes med å utbedre kode? Automatiserte tester sikrer at sårbarheter elimineres uten å ødelegge kontraktens tiltenkte funksjonelle logikk.

Finnes det økonomisk støtte tilgjengelig for forskere som bruker disse verktøyene? OpenAI forplikter seg til 10 millioner dollar i API-kreditter for å støtte defensiv cybersikkerhetsforskning.

Bitcoin spillvalg

100% Bonus opp til 1 BTC + 10% Ukentlig Innsatsfri Cashback

100% Bonus Opp Til 1 BTC + 10% Ukentlig Cashback

130% opp til 2 500 USDT + 200 Gratisspinn + 20% Ukentlig Innsatsfri Cashback

1000% Velkomstbonus + Gratis Veddemål opp til 1 BTC

Opp til 2 500 USDT + 150 Gratisspinn + Opp til 30% Rakeback

470% Bonus opp til $500 000 + 400 Gratisspinn + 20% Rakeback

3,5% Rakeback på Hvert Veddemål + Ukentlige Lodtrekninger

425% opp til 5 BTC + 100 Gratisspinn

100% opp til $20K + Daglig Rakeback