A OpenAI e a Paradigm apresentaram o EVMbench, um novo framework de benchmarking projetado para avaliar a capacidade de agentes de IA de detectar, corrigir e explorar vulnerabilidades em blockchains.
OpenAI e Paradigm lançam o EVMbench para medir a segurança de contratos inteligentes de IA

A OpenAI e a Paradigm lançaram oficialmente o EVMbench para enfrentar riscos de segurança em smart contracts que protegem mais de US$ 100 bilhões em criptoativos. O benchmark utiliza 120 vulnerabilidades selecionadas a partir de 40 auditorias profissionais, incluindo cenários da blockchain Tempo, para testar as capacidades de Inteligência Artificial (IA) em um ambiente isolado de Ethereum Virtual Machine (EVM).
O sistema avalia os agentes em três modos distintos: detecção de vulnerabilidades, correção funcional do código e execução ponta a ponta de exploits para drenar fundos. Testes recentes mostram que o modelo GPT-5.3-Codex alcança uma taxa de sucesso de 72,2% em tarefas de exploit, marcando um aumento significativo em relação aos 31,9% registrados pelo GPT-5 há apenas seis meses.
“Medir a capacidade do modelo neste domínio ajuda a acompanhar riscos cibernéticos emergentes e destaca a importância de usar sistemas de IA de forma defensiva para auditar e fortalecer contratos em produção”, de acordo com o anúncio da OpenAI.

Relatório: Blockchain Tempo da Stripe e Paradigm Garante Apoio de $500M da Thrive e Greenoaks
Descubra o impacto do apoio da Stripe enquanto a Tempo fecha sua rodada Série A de $500 milhões para aprimorar a infraestrutura de pagamento blockchain. read more.
Leia agora
Relatório: Blockchain Tempo da Stripe e Paradigm Garante Apoio de $500M da Thrive e Greenoaks
Descubra o impacto do apoio da Stripe enquanto a Tempo fecha sua rodada Série A de $500 milhões para aprimorar a infraestrutura de pagamento blockchain. read more.
Leia agora
Relatório: Blockchain Tempo da Stripe e Paradigm Garante Apoio de $500M da Thrive e Greenoaks
Leia agoraDescubra o impacto do apoio da Stripe enquanto a Tempo fecha sua rodada Série A de $500 milhões para aprimorar a infraestrutura de pagamento blockchain. read more.
🧭 Perguntas frequentes
• Qual é o principal objetivo do framework EVMbench? Ele mede quão eficazmente os agentes de IA identificam e resolvem vulnerabilidades de smart contracts de alta gravidade.
• Quais organizações colaboraram para desenvolver este novo benchmark de segurança? A OpenAI e a empresa de investimentos em cripto Paradigm co-desenvolveram o ambiente de testes EVMbench.
• Como o sistema verifica se um agente corrigiu o código com sucesso? Testes automatizados garantem que as vulnerabilidades sejam eliminadas sem quebrar a lógica funcional pretendida do contrato.
• Há apoio financeiro disponível para pesquisadores que usam essas ferramentas? A OpenAI está comprometendo US$ 10 milhões em créditos de API para apoiar pesquisas defensivas em cibersegurança.














