OpenAI और Paradigm ने EVMbench पेश किया है, जो एक नया बेंचमार्किंग फ्रेमवर्क है जिसे AI एजेंट्स की ब्लॉकचेन कमजोरियों का पता लगाने, उन्हें ठीक करने और उनका फायदा उठाने की क्षमता का मूल्यांकन करने के लिए डिज़ाइन किया गया है।
ओपनएआई और पैराडाइम ने एआई स्मार्ट कॉन्ट्रैक्ट सुरक्षा मापने के लिए ईवीएमबेंच लॉन्च किया।

ओपनएआई और पैराडाइम ने 100 अरब डॉलर से अधिक के क्रिप्टो परिसंपत्तियों को सुरक्षित करने वाले स्मार्ट कॉन्ट्रैक्ट्स में सुरक्षा जोखिमों को दूर करने के लिए आधिकारिक तौर पर ईवीएमबेंच लॉन्च किया है। यह बेंचमार्क सैंडबॉक्स्ड एथेरियम वर्चुअल मशीन (ईवीएम) वातावरण में आर्टिफिशियल इंटेलिजेंस (एआई) क्षमताओं का परीक्षण करने के लिए, टेम्पो ब्लॉकचेन सहित 40 पेशेवर ऑडिट से 120 चयनित कमजोरियों का उपयोग करता है।
यह प्रणाली एजेंटों का मूल्यांकन तीन अलग-अलग मोड में करती है: कमजोरियों का पता लगाना, कोड का कार्यात्मक पैचिंग, और फंड-ड्रेन करने वाले एक्सप्लॉइट्स का एंड-टू-एंड निष्पादन। हाल के परीक्षणों से पता चलता है कि GPT-5.3-Codex मॉडल एक्सप्लॉइट कार्यों में 72.2% सफलता दर हासिल करता है, जो कि सिर्फ छह महीने पहले GPT-5 द्वारा दर्ज किए गए 31.9% स्कोर से एक महत्वपूर्ण वृद्धि है।
ओपनएआई की घोषणा के अनुसार, "इस डोमेन में मॉडल की क्षमता को मापना उभरते हुए साइबर जोखिमों को ट्रैक करने में मदद करता है और तैनात अनुबंधों का ऑडिट करने तथा उन्हें मजबूत करने के लिए रक्षात्मक रूप से एआई सिस्टम का उपयोग करने के महत्व को उजागर करता है।"
🧭 अक्सर पूछे जाने वाले प्रश्न
• EVMbench फ्रेमवर्क का प्राथमिक उद्देश्य क्या है? यह मापता है कि AI एजेंट कितनी प्रभावी ढंग से उच्च-गंभीरता वाले स्मार्ट कॉन्ट्रैक्ट की कमजोरियों की पहचान करते हैं और उन्हें हल करते हैं।
• इस नए सुरक्षा बेंचमार्क को विकसित करने के लिए किन संगठनों ने सहयोग किया? OpenAI और क्रिप्टो निवेश फर्म Paradigm ने मिलकर EVMbench परीक्षण वातावरण विकसित किया।
• सिस्टम यह कैसे सत्यापित करता है कि कोई एजेंट सफलतापूर्वक कोड को पैच करता है? स्वचालित परीक्षण यह सुनिश्चित करते हैं कि अनुबंध के इच्छित कार्यात्मक तर्क को तोड़े बिना कमजोरियों को समाप्त किया जाए।
• क्या इन उपकरणों का उपयोग करने वाले शोधकर्ताओं के लिए वित्तीय सहायता उपलब्ध है? OpenAI रक्षात्मक साइबर सुरक्षा अनुसंधान का समर्थन करने के लिए $10 मिलियन के API क्रेडिट देने की प्रतिबद्धता जता रहा है।
















