OpenAI e Paradigm hanno introdotto EVMbench, un nuovo framework di benchmarking progettato per valutare la capacità degli agenti AI di rilevare, correggere e sfruttare le vulnerabilità della blockchain.
OpenAI e Paradigm lanciano EVMbench per misurare la sicurezza degli smart contract basati sull'intelligenza artificiale

OpenAI e Paradigm hanno lanciato ufficialmente EVMbench per affrontare i rischi di sicurezza negli smart contract che proteggono oltre 100 miliardi di dollari in cripto-asset. Il benchmark utilizza 120 vulnerabilità selezionate da 40 audit professionali, inclusi scenari dalla blockchain Tempo, per testare le capacità dell'intelligenza artificiale (AI) in un ambiente sandboxed Ethereum Virtual Machine (EVM).
Il sistema valuta gli agenti in tre modalità distinte: rilevamento delle vulnerabilità, correzione funzionale del codice ed esecuzione end-to-end di exploit per il drenaggio di fondi. Recenti test dimostrano che il modello GPT-5.3-Codex raggiunge un tasso di successo del 72,2% nelle attività di exploit, segnando un aumento significativo rispetto al punteggio del 31,9% registrato da GPT-5 solo sei mesi fa.
"Misurare la capacità del modello in questo ambito aiuta a monitorare i rischi informatici emergenti e sottolinea l'importanza di utilizzare i sistemi di IA in modo difensivo per controllare e rafforzare i contratti implementati", secondo l'annuncio di OpenAI.

Report: Il Blockchain Tempo di Stripe e Paradigm Ottiene un Finanziamento di $500M da Thrive e Greenoaks
Scopri l'impatto del sostegno di Stripe mentre Tempo chiude il suo round di Serie A da 500 milioni di dollari per migliorare l'infrastruttura di pagamento blockchain. read more.
Leggi ora
Report: Il Blockchain Tempo di Stripe e Paradigm Ottiene un Finanziamento di $500M da Thrive e Greenoaks
Scopri l'impatto del sostegno di Stripe mentre Tempo chiude il suo round di Serie A da 500 milioni di dollari per migliorare l'infrastruttura di pagamento blockchain. read more.
Leggi ora
Report: Il Blockchain Tempo di Stripe e Paradigm Ottiene un Finanziamento di $500M da Thrive e Greenoaks
Leggi oraScopri l'impatto del sostegno di Stripe mentre Tempo chiude il suo round di Serie A da 500 milioni di dollari per migliorare l'infrastruttura di pagamento blockchain. read more.
🧭 Domande frequenti
• Qual è lo scopo principale del framework EVMbench? Misura l'efficacia con cui gli agenti di IA identificano e risolvono le vulnerabilità degli smart contract ad alta gravità.
• Quali organizzazioni hanno collaborato allo sviluppo di questo nuovo benchmark di sicurezza? OpenAI e la società di investimento in criptovalute Paradigm hanno sviluppato congiuntamente l'ambiente di test EVMbench.
• In che modo il sistema verifica se un agente applica correttamente le patch al codice? Test automatizzati garantiscono che le vulnerabilità vengano eliminate senza compromettere la logica funzionale prevista dal contratto.
• È disponibile un sostegno finanziario per i ricercatori che utilizzano questi strumenti? OpenAI sta stanziando 10 milioni di dollari in crediti API per sostenere la ricerca sulla sicurezza informatica difensiva.
Tag in questa storia
Scelte di Gioco Bitcoin
3,5% di Rakeback su Ogni Scommessa + Estrazioni Settimanali
425% fino a 5 BTC + 100 Giri Gratuiti
100% fino a $20K + Rakeback Giornaliero















