OpenAI ve Paradigm, yapay zekâ ajanlarının blokzincir güvenlik açıklarını tespit etme, yamalama ve istismar etme yeteneğini değerlendirmek üzere tasarlanmış yeni bir kıyaslama çerçevesi olan EVMbench’i tanıttı.
OpenAI ve Paradigm, Yapay Zekâ Akıllı Sözleşme Güvenliğini Ölçmek İçin EVMbench’i Başlattı

OpenAI ve Paradigm, 100 milyar doların üzerinde kripto varlığını güvence altına alan akıllı sözleşmelerdeki güvenlik risklerini ele almak için EVMbench’i resmen başlattı. Kıyaslama, Tempo blokzincirinden senaryolar da dahil olmak üzere 40 profesyonel denetimden derlenmiş 120 küratörlü güvenlik açığını kullanarak, sanal alanlı bir Ethereum Sanal Makinesi (EVM) ortamında Yapay Zekâ (AI) yeteneklerini test ediyor.
Sistem, ajanları üç ayrı modda değerlendiriyor: güvenlik açıklarının tespiti, kodun işlevsel biçimde yamalanması ve fonları boşaltan istismarların uçtan uca yürütülmesi. Son testler, GPT-5.3-Codex modelinin istismar görevlerinde %72,2 başarı oranına ulaştığını ve bunun yalnızca altı ay önce GPT-5’in kaydettiği %31,9’luk skora kıyasla önemli bir artış olduğunu gösteriyor.
OpenAI duyurusuna göre, “Bu alanda model kabiliyetini ölçmek, ortaya çıkan siber riskleri takip etmeye yardımcı olur ve dağıtılmış sözleşmeleri denetlemek ve güçlendirmek için yapay zekâ sistemlerini savunma amaçlı kullanmanın önemini vurgular.”

Rapor: Stripe ve Paradigm’in Blockchain Tempo’su Thrive, Greenoaks’tan 500 Milyon Dolar Destek Aldı
Stripe'in desteğinin etkisini keşfedin, Tempo, blockchain ödeme altyapısını geliştirmek için 500 milyon dolarlık A Serisi turunu kapatıyor. read more.
Şimdi oku
Rapor: Stripe ve Paradigm’in Blockchain Tempo’su Thrive, Greenoaks’tan 500 Milyon Dolar Destek Aldı
Stripe'in desteğinin etkisini keşfedin, Tempo, blockchain ödeme altyapısını geliştirmek için 500 milyon dolarlık A Serisi turunu kapatıyor. read more.
Şimdi oku
Rapor: Stripe ve Paradigm’in Blockchain Tempo’su Thrive, Greenoaks’tan 500 Milyon Dolar Destek Aldı
Şimdi okuStripe'in desteğinin etkisini keşfedin, Tempo, blockchain ödeme altyapısını geliştirmek için 500 milyon dolarlık A Serisi turunu kapatıyor. read more.
🧭 SSS
• EVMbench çerçevesinin birincil amacı nedir? Yapay zekâ ajanlarının yüksek ciddiyetli akıllı sözleşme güvenlik açıklarını ne kadar etkili biçimde belirleyip giderdiğini ölçer.
• Bu yeni güvenlik kıyaslamasını geliştirmek için hangi kuruluşlar iş birliği yaptı? OpenAI ve kripto yatırım şirketi Paradigm, EVMbench test ortamını birlikte geliştirdi.
• Sistem, bir ajanın kodu başarıyla yamadığını nasıl doğruluyor? Otomatik testler, sözleşmenin amaçlanan işlevsel mantığını bozmadan güvenlik açıklarının ortadan kaldırıldığını doğrular.
• Bu araçları kullanan araştırmacılar için finansal destek mevcut mu? OpenAI, savunmaya yönelik siber güvenlik araştırmalarını desteklemek için 10 milyon dolarlık API kredisi taahhüt ediyor.













