OpenAI i Paradigm predstavili su EVMbench, novi okvir za benchmarkiranje osmišljen za procjenu sposobnosti AI agenata da otkriju, zakrpaju i iskoriste ranjivosti u blockchainu.
OpenAI i Paradigm pokreću EVMbench za mjerenje sigurnosti AI pametnih ugovora

OpenAI i Paradigm službeno su pokrenuli EVMbench kako bi odgovorili na sigurnosne rizike u pametnim ugovorima koji štite više od 100 milijardi dolara u kriptoimovini. Benchmark koristi 120 odabranih ranjivosti iz 40 profesionalnih revizija, uključujući scenarije iz Tempo blockchaina, kako bi testirao sposobnosti umjetne inteligencije (AI) u izoliranom okruženju Ethereum Virtual Machine (EVM).
Sustav procjenjuje agente u tri različita načina rada: otkrivanje ranjivosti, funkcionalno zakrpavanje koda i end-to-end izvođenje exploita za pražnjenje sredstava. Nedavna testiranja pokazuju da model GPT-5.3-Codex postiže stopu uspjeha od 72,2% u zadacima exploita, što predstavlja značajan porast u odnosu na rezultat od 31,9% koji je GPT-5 zabilježio prije samo šest mjeseci.
„Mjerenje sposobnosti modela u ovom području pomaže pratiti nove kibernetičke rizike i naglašava važnost obrambene upotrebe AI sustava za reviziju i jačanje već implementiranih ugovora”, navodi se u objavi OpenAI-ja.

Izvješće: Blockchain Tempo, projekt tvrtki Stripe i Paradigm, osigurava podršku od 500 milijuna dolara od strane Thrive i Greenoaks
Otkrijte utjecaj Stripeove podrške dok Tempo zatvara svojih 500 milijuna dolara u Seriji A kako bi unaprijedio infrastrukturu plaćanja na blockchainu. read more.
Pročitaj
Izvješće: Blockchain Tempo, projekt tvrtki Stripe i Paradigm, osigurava podršku od 500 milijuna dolara od strane Thrive i Greenoaks
Otkrijte utjecaj Stripeove podrške dok Tempo zatvara svojih 500 milijuna dolara u Seriji A kako bi unaprijedio infrastrukturu plaćanja na blockchainu. read more.
Pročitaj
Izvješće: Blockchain Tempo, projekt tvrtki Stripe i Paradigm, osigurava podršku od 500 milijuna dolara od strane Thrive i Greenoaks
PročitajOtkrijte utjecaj Stripeove podrške dok Tempo zatvara svojih 500 milijuna dolara u Seriji A kako bi unaprijedio infrastrukturu plaćanja na blockchainu. read more.
🧭 Često postavljana pitanja
• Koja je primarna svrha okvira EVMbench? Mjeri koliko učinkovito AI agenti identificiraju i rješavaju ranjivosti pametnih ugovora visoke ozbiljnosti.
• Koje su organizacije surađivale na razvoju ovog novog sigurnosnog benchmarka? OpenAI i kripto investicijska tvrtka Paradigm zajednički su razvili EVMbench testno okruženje.
• Kako sustav provjerava je li agent uspješno zakrpao kod? Automatizirani testovi osiguravaju da su ranjivosti uklonjene bez narušavanja predviđene funkcionalne logike ugovora.
• Je li dostupna financijska podrška za istraživače koji koriste ove alate? OpenAI se obvezuje na 10 milijuna dolara u API kreditima kako bi podržao obrambena istraživanja kibernetičke sigurnosti.
Oznake u ovom članku
Bitcoin odabiri igara
425% do 5 BTC + 100 Besplatnih Vrtnji















