Tarjoaa
News Bytes

OpenAI ja Paradigm julkaisevat EVMbenchin tekoälyä hyödyntävien älysopimusten turvallisuuden mittaamiseen

OpenAI ja Paradigm ovat esitellet EVMbenchin, uuden benchmark-kehyksen, joka on suunniteltu arvioimaan tekoälyagenttien kykyä havaita, paikata ja hyödyntää lohkoketjuhaavoittuvuuksia.

KIRJOITTAJA
JAA
OpenAI ja Paradigm julkaisevat EVMbenchin tekoälyä hyödyntävien älysopimusten turvallisuuden mittaamiseen

OpenAI ja Paradigm julkaisivat EVMbenchin virallisesti vastatakseen älysopimusten tietoturvariskeihin, jotka suojaavat yli 100 miljardin dollarin edestä krypto-omaisuutta. Benchmark hyödyntää 120 kuratoitua haavoittuvuutta 40 ammattilaisauditoinnista, mukaan lukien Tempo-lohkoketjun skenaariot, testatakseen tekoälyn (AI) kyvykkyyksiä eristetyssä Ethereum Virtual Machine (EVM) -ympäristössä.

Järjestelmä arvioi agentteja kolmessa erillisessä tilassa: haavoittuvuuksien havaitseminen, koodin toiminnallinen paikkaaminen sekä varoja tyhjentävien exploitien päästä päähän -suoritus. Tuore testaus osoittaa, että GPT-5.3-Codex-malli saavuttaa 72,2 %:n onnistumisasteen exploit-tehtävissä, mikä merkitsee huomattavaa kasvua verrattuna GPT-5:n vain kuusi kuukautta sitten kirjaamaan 31,9 %:n tulokseen.

“Mallin kyvykkyyden mittaaminen tällä osa-alueella auttaa seuraamaan nousevia kyberriskejä ja korostaa tekoälyjärjestelmien puolustavan käytön tärkeyttä käyttöönotettujen sopimusten auditoimisessa ja vahvistamisessa”, OpenAI:n tiedotteessa todetaan.

Raportti: Stripe ja Paradigmin Blockchain Tempo saavat 500 miljoonan dollarin tukea Thrivelta ja Greenoaksilta

Raportti: Stripe ja Paradigmin Blockchain Tempo saavat 500 miljoonan dollarin tukea Thrivelta ja Greenoaksilta

Tutustu Stripesin tuen vaikutukseen, kun Tempo päättää 500 miljoonan dollarin Series A -kierroksensa parantaakseen lohkoketjumaksujen infrastruktuuria. read more.

Lue nyt

🧭 UKK

Mikä on EVMbench-kehyksen ensisijainen tarkoitus? Se mittaa, kuinka tehokkaasti tekoälyagentit tunnistavat ja korjaavat vakavuudeltaan korkeita älysopimusten haavoittuvuuksia.

Mitkä organisaatiot tekivät yhteistyötä tämän uuden tietoturvabenchmarkin kehittämisessä? OpenAI ja kryptosijoitusyhtiö Paradigm kehittivät yhdessä EVMbench-testausympäristön.

Miten järjestelmä varmistaa, että agentti paikkaa koodin onnistuneesti? Automatisoidut testit varmistavat, että haavoittuvuudet poistuvat rikkomatta sopimuksen tarkoitettua toiminnallista logiikkaa.

Onko näitä työkaluja käyttäville tutkijoille saatavilla taloudellista tukea? OpenAI sitoutuu 10 miljoonaan dollariin API-hyvityksinä puolustavan kyberturvallisuustutkimuksen tukemiseksi.