За підтримки
News Bytes

OpenAI та Paradigm запускають EVMbench для вимірювання безпеки смартконтрактів з ШІ

OpenAI та Paradigm представили EVMbench — новий бенчмаркінговий фреймворк, створений для оцінювання здатності ШІ-агентів виявляти, виправляти та експлуатувати вразливості блокчейна.

АВТОР
ПОДІЛИТИСЯ
OpenAI та Paradigm запускають EVMbench для вимірювання безпеки смартконтрактів з ШІ

OpenAI та Paradigm офіційно запустили EVMbench, щоб протидіяти ризикам безпеки в смартконтрактах, які захищають понад $100 млрд у криптоактивах. Бенчмарк використовує 120 відібраних вразливостей із 40 професійних аудитів, зокрема сценарії з блокчейна Tempo, щоб тестувати можливості штучного інтелекту (AI) у ізольованому середовищі Ethereum Virtual Machine (EVM).

Система оцінює агентів у трьох різних режимах: виявлення вразливостей, функціональне виправлення коду та виконання експлойтів для виведення коштів «під ключ». Нещодавні тести показують, що модель GPT-5.3-Codex досягає 72,2% успішності в завданнях на експлуатацію, що є суттєвим зростанням порівняно з результатом 31,9%, зафіксованим у GPT-5 лише шість місяців тому.

«Вимірювання спроможності моделей у цій сфері допомагає відстежувати нові кіберризики та підкреслює важливість використання систем ШІ в оборонних цілях для аудиту й посилення вже розгорнутих контрактів», — йдеться в оголошенні OpenAI.

Звіт: Блокчейн Tempo від Stripe та Paradigm отримує підтримку в розмірі $500 млн від Thrive, Greenoaks

Звіт: Блокчейн Tempo від Stripe та Paradigm отримує підтримку в розмірі $500 млн від Thrive, Greenoaks

Відкрийте вплив підтримки Stripe, коли Tempo закриває свій раунд серії А на суму $500 мільйонів для покращення платіжної інфраструктури блокчейн. read more.

Читати

🧭 Поширені запитання

Яка основна мета фреймворку EVMbench? Він вимірює, наскільки ефективно ШІ-агенти виявляють і усувають критичні вразливості смартконтрактів.

Які організації співпрацювали над розробкою цього нового бенчмарку безпеки? OpenAI та криптоінвестиційна компанія Paradigm спільно розробили середовище тестування EVMbench.

Як система перевіряє, чи агент успішно пропатчив код? Автоматизовані тести гарантують, що вразливості усунено без порушення запланованої функціональної логіки контракту.

Чи доступна фінансова підтримка для дослідників, які користуються цими інструментами? OpenAI зобов’язується виділити $10 млн у вигляді API-кредитів для підтримки оборонних досліджень у сфері кібербезпеки.