Được cung cấp bởi
News Bytes

OpenAI và Paradigm ra mắt EVMbench để đo lường bảo mật hợp đồng thông minh AI

OpenAI và Paradigm đã giới thiệu EVMbench, một khung đánh giá hiệu năng mới được thiết kế để đánh giá khả năng của các tác nhân AI trong việc phát hiện, vá lỗi và khai thác các lỗ hổng blockchain.

TÁC GIẢ
CHIA SẺ
OpenAI và Paradigm ra mắt EVMbench để đo lường bảo mật hợp đồng thông minh AI

OpenAI và Paradigm đã chính thức ra mắt EVMbench nhằm giải quyết các rủi ro bảo mật trong hợp đồng thông minh đang bảo vệ hơn 100 tỷ USD tài sản tiền mã hóa. Bộ benchmark sử dụng 120 lỗ hổng được tuyển chọn từ 40 cuộc kiểm toán chuyên nghiệp, bao gồm các kịch bản từ blockchain Tempo, để kiểm tra năng lực của Trí tuệ Nhân tạo (AI) trong môi trường Ethereum Virtual Machine (EVM) dạng sandbox.

Hệ thống đánh giá các tác nhân qua ba chế độ riêng biệt: phát hiện lỗ hổng, vá mã theo đúng chức năng, và thực thi đầu-cuối các khai thác rút cạn quỹ. Các thử nghiệm gần đây cho thấy mô hình GPT-5.3-Codex đạt tỷ lệ thành công 72,2% trong các tác vụ khai thác, đánh dấu mức tăng đáng kể so với điểm số 31,9% mà GPT-5 ghi nhận chỉ sáu tháng trước.

“Việc đo lường năng lực mô hình trong lĩnh vực này giúp theo dõi các rủi ro an ninh mạng đang nổi lên và nhấn mạnh tầm quan trọng của việc sử dụng các hệ thống AI theo hướng phòng thủ để kiểm toán và tăng cường độ vững chắc cho các hợp đồng đã triển khai,” theo thông báo của OpenAI.

Báo cáo: Blockchain Tempo của Stripe và Paradigm nhận được 500 triệu USD từ Thrive, Greenoaks hậu thuẫn

Báo cáo: Blockchain Tempo của Stripe và Paradigm nhận được 500 triệu USD từ Thrive, Greenoaks hậu thuẫn

Khám phá tác động của sự hỗ trợ từ Stripe khi Tempo kết thúc vòng gọi vốn Series A trị giá 500 triệu đô la để nâng cao cơ sở hạ tầng thanh toán blockchain. read more.

Đọc ngay

🧭 Câu hỏi thường gặp

Mục đích chính của khung EVMbench là gì? Nó đo lường mức độ hiệu quả của các tác nhân AI trong việc xác định và khắc phục các lỗ hổng hợp đồng thông minh có mức độ nghiêm trọng cao.

Những tổ chức nào đã hợp tác để phát triển bộ benchmark bảo mật mới này? OpenAI và công ty đầu tư tiền mã hóa Paradigm đã đồng phát triển môi trường kiểm thử EVMbench.

Hệ thống xác minh việc một tác nhân vá mã thành công như thế nào? Các bài kiểm tra tự động đảm bảo lỗ hổng được loại bỏ mà không làm hỏng logic chức năng dự kiến của hợp đồng.

Có hỗ trợ tài chính dành cho các nhà nghiên cứu sử dụng những công cụ này không? OpenAI cam kết 10 triệu USD tín dụng API để hỗ trợ nghiên cứu an ninh mạng theo hướng phòng thủ.