OpenAI ja Paradigm ovat esitellet EVMbenchin, uuden benchmark-kehyksen, joka on suunniteltu arvioimaan tekoälyagenttien kykyä havaita, paikata ja hyödyntää lohkoketjuhaavoittuvuuksia.
OpenAI ja Paradigm julkaisevat EVMbenchin tekoälyä hyödyntävien älysopimusten turvallisuuden mittaamiseen

OpenAI ja Paradigm julkaisivat EVMbenchin virallisesti vastatakseen älysopimusten tietoturvariskeihin, jotka suojaavat yli 100 miljardin dollarin edestä krypto-omaisuutta. Benchmark hyödyntää 120 kuratoitua haavoittuvuutta 40 ammattilaisauditoinnista, mukaan lukien Tempo-lohkoketjun skenaariot, testatakseen tekoälyn (AI) kyvykkyyksiä eristetyssä Ethereum Virtual Machine (EVM) -ympäristössä.
Järjestelmä arvioi agentteja kolmessa erillisessä tilassa: haavoittuvuuksien havaitseminen, koodin toiminnallinen paikkaaminen sekä varoja tyhjentävien exploitien päästä päähän -suoritus. Tuore testaus osoittaa, että GPT-5.3-Codex-malli saavuttaa 72,2 %:n onnistumisasteen exploit-tehtävissä, mikä merkitsee huomattavaa kasvua verrattuna GPT-5:n vain kuusi kuukautta sitten kirjaamaan 31,9 %:n tulokseen.
“Mallin kyvykkyyden mittaaminen tällä osa-alueella auttaa seuraamaan nousevia kyberriskejä ja korostaa tekoälyjärjestelmien puolustavan käytön tärkeyttä käyttöönotettujen sopimusten auditoimisessa ja vahvistamisessa”, OpenAI:n tiedotteessa todetaan.

Raportti: Stripe ja Paradigmin Blockchain Tempo saavat 500 miljoonan dollarin tukea Thrivelta ja Greenoaksilta
Tutustu Stripesin tuen vaikutukseen, kun Tempo päättää 500 miljoonan dollarin Series A -kierroksensa parantaakseen lohkoketjumaksujen infrastruktuuria. read more.
Lue nyt
Raportti: Stripe ja Paradigmin Blockchain Tempo saavat 500 miljoonan dollarin tukea Thrivelta ja Greenoaksilta
Tutustu Stripesin tuen vaikutukseen, kun Tempo päättää 500 miljoonan dollarin Series A -kierroksensa parantaakseen lohkoketjumaksujen infrastruktuuria. read more.
Lue nyt
Raportti: Stripe ja Paradigmin Blockchain Tempo saavat 500 miljoonan dollarin tukea Thrivelta ja Greenoaksilta
Lue nytTutustu Stripesin tuen vaikutukseen, kun Tempo päättää 500 miljoonan dollarin Series A -kierroksensa parantaakseen lohkoketjumaksujen infrastruktuuria. read more.
🧭 UKK
• Mikä on EVMbench-kehyksen ensisijainen tarkoitus? Se mittaa, kuinka tehokkaasti tekoälyagentit tunnistavat ja korjaavat vakavuudeltaan korkeita älysopimusten haavoittuvuuksia.
• Mitkä organisaatiot tekivät yhteistyötä tämän uuden tietoturvabenchmarkin kehittämisessä? OpenAI ja kryptosijoitusyhtiö Paradigm kehittivät yhdessä EVMbench-testausympäristön.
• Miten järjestelmä varmistaa, että agentti paikkaa koodin onnistuneesti? Automatisoidut testit varmistavat, että haavoittuvuudet poistuvat rikkomatta sopimuksen tarkoitettua toiminnallista logiikkaa.
• Onko näitä työkaluja käyttäville tutkijoille saatavilla taloudellista tukea? OpenAI sitoutuu 10 miljoonaan dollariin API-hyvityksinä puolustavan kyberturvallisuustutkimuksen tukemiseksi.














