OpenAI i Paradigm zaprezentowały EVMbench, nowe ramy benchmarkingowe zaprojektowane do oceny zdolności agentów AI do wykrywania, łatania i wykorzystywania podatności w blockchainie.
OpenAI i Paradigm uruchamiają EVMbench do pomiaru bezpieczeństwa inteligentnych kontraktów AI

OpenAI i Paradigm oficjalnie uruchomiły EVMbench, aby przeciwdziałać ryzykom bezpieczeństwa w inteligentnych kontraktach, które zabezpieczają ponad 100 mld dolarów w aktywach krypto. Benchmark wykorzystuje 120 wyselekcjonowanych podatności z 40 profesjonalnych audytów, w tym scenariusze z blockchaina Tempo, aby testować możliwości sztucznej inteligencji (AI) w izolowanym środowisku Ethereum Virtual Machine (EVM).
System ocenia agentów w trzech odrębnych trybach: wykrywanie podatności, funkcjonalne łatanie kodu oraz kompleksowe wykonanie exploitów opróżniających środki. Ostatnie testy pokazują, że model GPT-5.3-Codex osiąga 72,2% skuteczności w zadaniach exploitów, co stanowi znaczący wzrost względem wyniku 31,9% odnotowanego przez GPT-5 zaledwie sześć miesięcy temu.
„Mierzenie możliwości modeli w tej dziedzinie pomaga śledzić pojawiające się ryzyka cybernetyczne i podkreśla znaczenie defensywnego wykorzystania systemów AI do audytowania i wzmacniania wdrożonych kontraktów” — wynika z komunikatu OpenAI.

Raport: Blockchain Tempo Stripe i Paradigm Zabezpiecza Finansowanie w Wysokości 500 mln USD od Thrive, Greenoaks
Odkryj wpływ wsparcia Stripe, gdy Tempo zamyka rundę inwestycyjną Serii A na kwotę 500 milionów dolarów, aby wzmocnić infrastrukturę płatności blockchain. read more.
Czytaj teraz
Raport: Blockchain Tempo Stripe i Paradigm Zabezpiecza Finansowanie w Wysokości 500 mln USD od Thrive, Greenoaks
Odkryj wpływ wsparcia Stripe, gdy Tempo zamyka rundę inwestycyjną Serii A na kwotę 500 milionów dolarów, aby wzmocnić infrastrukturę płatności blockchain. read more.
Czytaj teraz
Raport: Blockchain Tempo Stripe i Paradigm Zabezpiecza Finansowanie w Wysokości 500 mln USD od Thrive, Greenoaks
Czytaj terazOdkryj wpływ wsparcia Stripe, gdy Tempo zamyka rundę inwestycyjną Serii A na kwotę 500 milionów dolarów, aby wzmocnić infrastrukturę płatności blockchain. read more.
🧭 FAQ
• Jaki jest główny cel frameworka EVMbench? Mierzy, jak skutecznie agenci AI identyfikują i usuwają podatności inteligentnych kontraktów o wysokiej krytyczności.
• Które organizacje współpracowały przy opracowaniu tego nowego benchmarku bezpieczeństwa? OpenAI oraz firma inwestycyjna z branży krypto Paradigm wspólnie opracowały środowisko testowe EVMbench.
• W jaki sposób system weryfikuje, czy agent skutecznie załatał kod? Zautomatyzowane testy zapewniają, że podatności zostały wyeliminowane bez naruszania zamierzonej logiki funkcjonalnej kontraktu.
• Czy dostępne jest wsparcie finansowe dla badaczy korzystających z tych narzędzi? OpenAI przeznacza 10 mln dolarów w kredytach API na wsparcie defensywnych badań z zakresu cyberbezpieczeństwa.









