Obsługiwane przez
News Bytes

OpenAI i Paradigm uruchamiają EVMbench do pomiaru bezpieczeństwa inteligentnych kontraktów AI

OpenAI i Paradigm zaprezentowały EVMbench, nowe ramy benchmarkingowe zaprojektowane do oceny zdolności agentów AI do wykrywania, łatania i wykorzystywania podatności w blockchainie.

UDOSTĘPNIJ
OpenAI i Paradigm uruchamiają EVMbench do pomiaru bezpieczeństwa inteligentnych kontraktów AI

OpenAI i Paradigm oficjalnie uruchomiły EVMbench, aby przeciwdziałać ryzykom bezpieczeństwa w inteligentnych kontraktach, które zabezpieczają ponad 100 mld dolarów w aktywach krypto. Benchmark wykorzystuje 120 wyselekcjonowanych podatności z 40 profesjonalnych audytów, w tym scenariusze z blockchaina Tempo, aby testować możliwości sztucznej inteligencji (AI) w izolowanym środowisku Ethereum Virtual Machine (EVM).

System ocenia agentów w trzech odrębnych trybach: wykrywanie podatności, funkcjonalne łatanie kodu oraz kompleksowe wykonanie exploitów opróżniających środki. Ostatnie testy pokazują, że model GPT-5.3-Codex osiąga 72,2% skuteczności w zadaniach exploitów, co stanowi znaczący wzrost względem wyniku 31,9% odnotowanego przez GPT-5 zaledwie sześć miesięcy temu.

„Mierzenie możliwości modeli w tej dziedzinie pomaga śledzić pojawiające się ryzyka cybernetyczne i podkreśla znaczenie defensywnego wykorzystania systemów AI do audytowania i wzmacniania wdrożonych kontraktów” — wynika z komunikatu OpenAI.

Raport: Blockchain Tempo Stripe i Paradigm Zabezpiecza Finansowanie w Wysokości 500 mln USD od Thrive, Greenoaks

Raport: Blockchain Tempo Stripe i Paradigm Zabezpiecza Finansowanie w Wysokości 500 mln USD od Thrive, Greenoaks

Odkryj wpływ wsparcia Stripe, gdy Tempo zamyka rundę inwestycyjną Serii A na kwotę 500 milionów dolarów, aby wzmocnić infrastrukturę płatności blockchain. read more.

Czytaj teraz

🧭 FAQ

Jaki jest główny cel frameworka EVMbench? Mierzy, jak skutecznie agenci AI identyfikują i usuwają podatności inteligentnych kontraktów o wysokiej krytyczności.

Które organizacje współpracowały przy opracowaniu tego nowego benchmarku bezpieczeństwa? OpenAI oraz firma inwestycyjna z branży krypto Paradigm wspólnie opracowały środowisko testowe EVMbench.

W jaki sposób system weryfikuje, czy agent skutecznie załatał kod? Zautomatyzowane testy zapewniają, że podatności zostały wyeliminowane bez naruszania zamierzonej logiki funkcjonalnej kontraktu.

Czy dostępne jest wsparcie finansowe dla badaczy korzystających z tych narzędzi? OpenAI przeznacza 10 mln dolarów w kredytach API na wsparcie defensywnych badań z zakresu cyberbezpieczeństwa.