OpenAI та Paradigm представили EVMbench — новий бенчмаркінговий фреймворк, створений для оцінювання здатності ШІ-агентів виявляти, виправляти та експлуатувати вразливості блокчейна.
OpenAI та Paradigm запускають EVMbench для вимірювання безпеки смартконтрактів з ШІ

OpenAI та Paradigm офіційно запустили EVMbench, щоб протидіяти ризикам безпеки в смартконтрактах, які захищають понад $100 млрд у криптоактивах. Бенчмарк використовує 120 відібраних вразливостей із 40 професійних аудитів, зокрема сценарії з блокчейна Tempo, щоб тестувати можливості штучного інтелекту (AI) у ізольованому середовищі Ethereum Virtual Machine (EVM).
Система оцінює агентів у трьох різних режимах: виявлення вразливостей, функціональне виправлення коду та виконання експлойтів для виведення коштів «під ключ». Нещодавні тести показують, що модель GPT-5.3-Codex досягає 72,2% успішності в завданнях на експлуатацію, що є суттєвим зростанням порівняно з результатом 31,9%, зафіксованим у GPT-5 лише шість місяців тому.
«Вимірювання спроможності моделей у цій сфері допомагає відстежувати нові кіберризики та підкреслює важливість використання систем ШІ в оборонних цілях для аудиту й посилення вже розгорнутих контрактів», — йдеться в оголошенні OpenAI.

Звіт: Блокчейн Tempo від Stripe та Paradigm отримує підтримку в розмірі $500 млн від Thrive, Greenoaks
Відкрийте вплив підтримки Stripe, коли Tempo закриває свій раунд серії А на суму $500 мільйонів для покращення платіжної інфраструктури блокчейн. read more.
Читати
Звіт: Блокчейн Tempo від Stripe та Paradigm отримує підтримку в розмірі $500 млн від Thrive, Greenoaks
Відкрийте вплив підтримки Stripe, коли Tempo закриває свій раунд серії А на суму $500 мільйонів для покращення платіжної інфраструктури блокчейн. read more.
Читати
Звіт: Блокчейн Tempo від Stripe та Paradigm отримує підтримку в розмірі $500 млн від Thrive, Greenoaks
ЧитатиВідкрийте вплив підтримки Stripe, коли Tempo закриває свій раунд серії А на суму $500 мільйонів для покращення платіжної інфраструктури блокчейн. read more.
🧭 Поширені запитання
• Яка основна мета фреймворку EVMbench? Він вимірює, наскільки ефективно ШІ-агенти виявляють і усувають критичні вразливості смартконтрактів.
• Які організації співпрацювали над розробкою цього нового бенчмарку безпеки? OpenAI та криптоінвестиційна компанія Paradigm спільно розробили середовище тестування EVMbench.
• Як система перевіряє, чи агент успішно пропатчив код? Автоматизовані тести гарантують, що вразливості усунено без порушення запланованої функціональної логіки контракту.
• Чи доступна фінансова підтримка для дослідників, які користуються цими інструментами? OpenAI зобов’язується виділити $10 млн у вигляді API-кредитів для підтримки оборонних досліджень у сфері кібербезпеки.














