OpenAI und Paradigm haben EVMbench vorgestellt, ein neues Benchmarking-Framework, mit dem die Fähigkeit von KI-Agenten zur Erkennung, Behebung und Ausnutzung von Blockchain-Sicherheitslücken bewertet werden soll.
OpenAI und Paradigm starten EVMbench zur Messung der Sicherheit von KI-Smart Contracts

OpenAI und Paradigm haben EVMbench offiziell eingeführt, um Sicherheitsrisiken in Smart Contracts zu beheben, die Krypto-Assets im Wert von über 100 Milliarden US-Dollar sichern. Der Benchmark nutzt 120 kuratierte Schwachstellen aus 40 professionellen Audits, darunter Szenarien aus der Tempo-Blockchain, um die Fähigkeiten der künstlichen Intelligenz (KI) in einer sandboxed Ethereum Virtual Machine (EVM)-Umgebung zu testen.
Das System bewertet Agenten in drei verschiedenen Modi: Erkennung von Schwachstellen, funktionales Patchen von Code und End-to-End-Ausführung von Exploits zum Abziehen von Geldern. Jüngste Tests zeigen, dass das GPT-5.3-Codex-Modell eine Erfolgsquote von 72,2 % bei Exploit-Aufgaben erreicht, was eine deutliche Steigerung gegenüber den 31,9 % darstellt, die GPT-5 vor nur sechs Monaten erzielte.
„Die Messung der Modellfähigkeit in diesem Bereich hilft dabei, aufkommende Cyberrisiken zu verfolgen, und unterstreicht die Bedeutung des defensiven Einsatzes von KI-Systemen zur Prüfung und Stärkung eingesetzter Verträge“, heißt es in der Ankündigung von OpenAI.

Bericht: Stripe und Paradigms Blockchain Tempo sichert sich $500M Unterstützung von Thrive, Greenoaks
Entdecken Sie die Auswirkungen der Unterstützung durch Stripe, als Tempo seine Series A Finanzierungsrunde von 500 Millionen US-Dollar abschließt, um die Blockchain-Zahlungsinfrastruktur zu verbessern. read more.
Jetzt lesen
Bericht: Stripe und Paradigms Blockchain Tempo sichert sich $500M Unterstützung von Thrive, Greenoaks
Entdecken Sie die Auswirkungen der Unterstützung durch Stripe, als Tempo seine Series A Finanzierungsrunde von 500 Millionen US-Dollar abschließt, um die Blockchain-Zahlungsinfrastruktur zu verbessern. read more.
Jetzt lesen
Bericht: Stripe und Paradigms Blockchain Tempo sichert sich $500M Unterstützung von Thrive, Greenoaks
Jetzt lesenEntdecken Sie die Auswirkungen der Unterstützung durch Stripe, als Tempo seine Series A Finanzierungsrunde von 500 Millionen US-Dollar abschließt, um die Blockchain-Zahlungsinfrastruktur zu verbessern. read more.
🧭 FAQs
• Was ist der Hauptzweck des EVMbench-Frameworks? Es misst, wie effektiv KI-Agenten schwerwiegende Schwachstellen in Smart Contracts identifizieren und beheben.
• Welche Organisationen haben bei der Entwicklung dieses neuen Sicherheitsbenchmarks zusammengearbeitet? OpenAI und die Krypto-Investmentfirma Paradigm haben die EVMbench-Testumgebung gemeinsam entwickelt.
• Wie überprüft das System, ob ein Agent den Code erfolgreich gepatcht hat? Automatisierte Tests stellen sicher, dass Schwachstellen beseitigt werden, ohne die beabsichtigte Funktionslogik des Vertrags zu beeinträchtigen.
• Gibt es finanzielle Unterstützung für Forscher, die diese Tools nutzen? OpenAI stellt API-Gutschriften in Höhe von 10 Millionen US-Dollar zur Verfügung, um defensive Cybersicherheitsforschung zu unterstützen.




