Toetab
News Bytes

OpenAI ja Paradigm käivitavad EVMbenchi, et mõõta tehisintellekti nutilepingute turvalisust

OpenAI ja Paradigm on tutvustanud EVMbenchi, uut võrdluskatsete raamistikku, mis on loodud hindama tehisintellekti agentide võimet tuvastada, paikata ja ära kasutada plokiahela haavatavusi.

JAGA
OpenAI ja Paradigm käivitavad EVMbenchi, et mõõta tehisintellekti nutilepingute turvalisust

OpenAI ja Paradigm käivitasid EVMbenchi ametlikult, et tegeleda turvariskidega nutilepingutes, mis kaitsevad üle 100 miljardi dollari väärtuses krüptovarasid. Võrdluskatse kasutab 120 kureeritud haavatavust 40 professionaalsest auditist, sealhulgas Tempo plokiahela stsenaariume, et testida tehisintellekti (AI) võimekust liivakastitud Ethereum Virtual Machine’i (EVM) keskkonnas.

Süsteem hindab agente kolmes eraldiseisvas režiimis: haavatavuste tuvastamine, koodi funktsionaalne paikamine ning otsast lõpuni vahendite tühjendamise exploit’ide käivitamine. Hiljutised testid näitavad, et mudel GPT-5.3-Codex saavutab exploit-ülesannetes 72,2% edukuse, mis on märkimisväärne kasv võrreldes GPT-5 poolt vaid kuus kuud tagasi saadud 31,9% tulemusega.

„Mudeli võimekuse mõõtmine selles valdkonnas aitab jälgida esilekerkivaid küberriske ja rõhutab AI-süsteemide kaitseotstarbelise kasutamise tähtsust, et auditeerida ja tugevdada juurutatud lepinguid,“ seisab OpenAI teadaandes.

Aruanne: Stripe ja Paradigmi plokiahel Tempo kindlustab 500 miljoni dollari suuruse toetuse Thrive'ilt ja Greenoaksilt

Aruanne: Stripe ja Paradigmi plokiahel Tempo kindlustab 500 miljoni dollari suuruse toetuse Thrive'ilt ja Greenoaksilt

Avasta Stripe'i toetuse mõju, kui Tempo lõpetab oma 500 miljoni dollari suuruse A-seeria vooru, et täiustada plokiahela maksete infrastruktuuri. read more.

Loe nüüd

🧭 KKK

Mis on EVMbench-raamistiku peamine eesmärk? See mõõdab, kui tõhusalt AI-agendid tuvastavad ja lahendavad kõrge kriitilisusega nutilepingute haavatavusi.

Millised organisatsioonid tegid koostööd selle uue turvavõrdluskatse väljatöötamisel? OpenAI ja krüptoinvesteeringute ettevõte Paradigm arendasid EVMbenchi testimiskeskkonna ühiselt.

Kuidas süsteem kontrollib, kas agent on koodi edukalt paiganud? Automatiseeritud testid tagavad, et haavatavused on kõrvaldatud ilma lepingu ettenähtud funktsionaalset loogikat lõhkumata.

Kas nende tööriistade kasutajatele on saadaval rahaline toetus? OpenAI eraldab 10 miljonit dollarit API krediidina, et toetada kaitseotstarbelist küberjulgeoleku uurimist.

Bitcoin mänguvalikud

100% boonus kuni 1 BTC + 10% iganädalane panusevaba cashback

100% Boonus Kuni 1 BTC + 10% Iganädalane Cashback

130% kuni 2 500 USDT + 200 tasuta keerutust + 20% iganädalane panusevaba cashback

1000% tervitusboonus + tasuta panus kuni 1 BTC

Kuni 2 500 USDT + 150 tasuta keerutust + kuni 30% rakeback

470% boonus kuni $500 000 + 400 tasuta keerutust + 20% rakeback

3,5% rakeback igal panusel + iganädalased loosimised

425% kuni 5 BTC + 100 tasuta keerutust

100% kuni $20K + igapäevane rakeback