OpenAI ja Paradigm on tutvustanud EVMbenchi, uut võrdluskatsete raamistikku, mis on loodud hindama tehisintellekti agentide võimet tuvastada, paikata ja ära kasutada plokiahela haavatavusi.
OpenAI ja Paradigm käivitavad EVMbenchi, et mõõta tehisintellekti nutilepingute turvalisust

OpenAI ja Paradigm käivitasid EVMbenchi ametlikult, et tegeleda turvariskidega nutilepingutes, mis kaitsevad üle 100 miljardi dollari väärtuses krüptovarasid. Võrdluskatse kasutab 120 kureeritud haavatavust 40 professionaalsest auditist, sealhulgas Tempo plokiahela stsenaariume, et testida tehisintellekti (AI) võimekust liivakastitud Ethereum Virtual Machine’i (EVM) keskkonnas.
Süsteem hindab agente kolmes eraldiseisvas režiimis: haavatavuste tuvastamine, koodi funktsionaalne paikamine ning otsast lõpuni vahendite tühjendamise exploit’ide käivitamine. Hiljutised testid näitavad, et mudel GPT-5.3-Codex saavutab exploit-ülesannetes 72,2% edukuse, mis on märkimisväärne kasv võrreldes GPT-5 poolt vaid kuus kuud tagasi saadud 31,9% tulemusega.
„Mudeli võimekuse mõõtmine selles valdkonnas aitab jälgida esilekerkivaid küberriske ja rõhutab AI-süsteemide kaitseotstarbelise kasutamise tähtsust, et auditeerida ja tugevdada juurutatud lepinguid,“ seisab OpenAI teadaandes.

Aruanne: Stripe ja Paradigmi plokiahel Tempo kindlustab 500 miljoni dollari suuruse toetuse Thrive'ilt ja Greenoaksilt
Avasta Stripe'i toetuse mõju, kui Tempo lõpetab oma 500 miljoni dollari suuruse A-seeria vooru, et täiustada plokiahela maksete infrastruktuuri. read more.
Loe nüüd
Aruanne: Stripe ja Paradigmi plokiahel Tempo kindlustab 500 miljoni dollari suuruse toetuse Thrive'ilt ja Greenoaksilt
Avasta Stripe'i toetuse mõju, kui Tempo lõpetab oma 500 miljoni dollari suuruse A-seeria vooru, et täiustada plokiahela maksete infrastruktuuri. read more.
Loe nüüd
Aruanne: Stripe ja Paradigmi plokiahel Tempo kindlustab 500 miljoni dollari suuruse toetuse Thrive'ilt ja Greenoaksilt
Loe nüüdAvasta Stripe'i toetuse mõju, kui Tempo lõpetab oma 500 miljoni dollari suuruse A-seeria vooru, et täiustada plokiahela maksete infrastruktuuri. read more.
🧭 KKK
• Mis on EVMbench-raamistiku peamine eesmärk? See mõõdab, kui tõhusalt AI-agendid tuvastavad ja lahendavad kõrge kriitilisusega nutilepingute haavatavusi.
• Millised organisatsioonid tegid koostööd selle uue turvavõrdluskatse väljatöötamisel? OpenAI ja krüptoinvesteeringute ettevõte Paradigm arendasid EVMbenchi testimiskeskkonna ühiselt.
• Kuidas süsteem kontrollib, kas agent on koodi edukalt paiganud? Automatiseeritud testid tagavad, et haavatavused on kõrvaldatud ilma lepingu ettenähtud funktsionaalset loogikat lõhkumata.
• Kas nende tööriistade kasutajatele on saadaval rahaline toetus? OpenAI eraldab 10 miljonit dollarit API krediidina, et toetada kaitseotstarbelist küberjulgeoleku uurimist.
Sildid selles loos
Bitcoin mänguvalikud
425% kuni 5 BTC + 100 tasuta keerutust















