제공
News Bytes

OpenAI와 Paradigm, AI 스마트 컨트랙트 보안을 측정하기 위한 EVMbench 출시

OpenAI와 Paradigm은 AI 에이전트가 블록체인 취약점을 탐지하고, 패치하며, 악용하는 능력을 평가하도록 설계된 새로운 벤치마킹 프레임워크인 EVMbench를 소개했습니다.

OpenAI와 Paradigm, AI 스마트 컨트랙트 보안을 측정하기 위한 EVMbench 출시

OpenAI와 Paradigm은 1,000억 달러가 넘는 암호자산을 보호하는 스마트 계약의 보안 위험을 해결하기 위해 EVMbench를 공식 출시했습니다. 이 벤치마크는 Tempo 블록체인의 시나리오를 포함해 40건의 전문 감사에서 선별한 120개의 취약점을 활용하며, 샌드박스 처리된 이더리움 가상 머신(EVM) 환경에서 인공지능(AI) 역량을 테스트합니다.

이 시스템은 취약점 탐지, 코드의 기능적 패치, 자금 탈취 익스플로잇의 엔드투엔드 실행 등 세 가지 뚜렷한 모드에서 에이전트를 평가합니다. 최근 테스트에 따르면 GPT-5.3-Codex 모델은 익스플로잇 과제에서 72.2%의 성공률을 달성했으며, 이는 불과 6개월 전 GPT-5가 기록한 31.9% 점수에서 크게 상승한 수치입니다.

OpenAI 발표에 따르면 “이 도메인에서 모델의 역량을 측정하는 것은 새로운 사이버 위험을 추적하는 데 도움이 되며, 배포된 계약을 감사하고 강화하기 위해 AI 시스템을 방어적으로 활용하는 것의 중요성을 부각시킨다”고 했습니다.

보고서: Stripe 및 Paradigm의 블록체인 Tempo가 Thrive, Greenoaks로부터 5억 달러의 지원을 확보

보고서: Stripe 및 Paradigm의 블록체인 Tempo가 Thrive, Greenoaks로부터 5억 달러의 지원을 확보

Stripe의 지원이 Tempo의 블록체인 결제 인프라 강화를 위해 5억 달러 시리즈 A 라운드를 마감하면서 미친 영향을 발견하십시오. read more.

지금 읽기

🧭 자주 묻는 질문(FAQs)

EVMbench 프레임워크의 주요 목적은 무엇인가요? AI 에이전트가 심각도가 높은 스마트 계약 취약점을 얼마나 효과적으로 식별하고 해결하는지 측정합니다.

이 새로운 보안 벤치마크를 개발하기 위해 협력한 조직은 어디인가요? OpenAI와 암호화폐 투자사 Paradigm이 EVMbench 테스트 환경을 공동 개발했습니다.

시스템은 에이전트가 코드 패치에 성공했는지 어떻게 검증하나요? 자동화된 테스트를 통해 취약점이 제거되었는지, 그리고 계약의 의도된 기능적 로직이 손상되지 않았는지를 확인합니다.

이 도구를 사용하는 연구자를 위한 재정적 지원이 있나요? OpenAI는 방어적 사이버보안 연구를 지원하기 위해 API 크레딧 1,000만 달러를 제공할 예정입니다.