Bereitgestellt von
News Bytes

OpenAI und Paradigm starten EVMbench zur Messung der Sicherheit von KI-Smart Contracts

OpenAI und Paradigm haben EVMbench vorgestellt, ein neues Benchmarking-Framework, mit dem die Fähigkeit von KI-Agenten zur Erkennung, Behebung und Ausnutzung von Blockchain-Sicherheitslücken bewertet werden soll.

GESCHRIEBEN VON
TEILEN
OpenAI und Paradigm starten EVMbench zur Messung der Sicherheit von KI-Smart Contracts

OpenAI und Paradigm haben EVMbench offiziell eingeführt, um Sicherheitsrisiken in Smart Contracts zu beheben, die Krypto-Assets im Wert von über 100 Milliarden US-Dollar sichern. Der Benchmark nutzt 120 kuratierte Schwachstellen aus 40 professionellen Audits, darunter Szenarien aus der Tempo-Blockchain, um die Fähigkeiten der künstlichen Intelligenz (KI) in einer sandboxed Ethereum Virtual Machine (EVM)-Umgebung zu testen.

Das System bewertet Agenten in drei verschiedenen Modi: Erkennung von Schwachstellen, funktionales Patchen von Code und End-to-End-Ausführung von Exploits zum Abziehen von Geldern. Jüngste Tests zeigen, dass das GPT-5.3-Codex-Modell eine Erfolgsquote von 72,2 % bei Exploit-Aufgaben erreicht, was eine deutliche Steigerung gegenüber den 31,9 % darstellt, die GPT-5 vor nur sechs Monaten erzielte.

„Die Messung der Modellfähigkeit in diesem Bereich hilft dabei, aufkommende Cyberrisiken zu verfolgen, und unterstreicht die Bedeutung des defensiven Einsatzes von KI-Systemen zur Prüfung und Stärkung eingesetzter Verträge“, heißt es in der Ankündigung von OpenAI.

Bericht: Stripe und Paradigms Blockchain Tempo sichert sich $500M Unterstützung von Thrive, Greenoaks

Bericht: Stripe und Paradigms Blockchain Tempo sichert sich $500M Unterstützung von Thrive, Greenoaks

Entdecken Sie die Auswirkungen der Unterstützung durch Stripe, als Tempo seine Series A Finanzierungsrunde von 500 Millionen US-Dollar abschließt, um die Blockchain-Zahlungsinfrastruktur zu verbessern. read more.

Jetzt lesen

🧭 FAQs

Was ist der Hauptzweck des EVMbench-Frameworks? Es misst, wie effektiv KI-Agenten schwerwiegende Schwachstellen in Smart Contracts identifizieren und beheben.

Welche Organisationen haben bei der Entwicklung dieses neuen Sicherheitsbenchmarks zusammengearbeitet? OpenAI und die Krypto-Investmentfirma Paradigm haben die EVMbench-Testumgebung gemeinsam entwickelt.

Wie überprüft das System, ob ein Agent den Code erfolgreich gepatcht hat? Automatisierte Tests stellen sicher, dass Schwachstellen beseitigt werden, ohne die beabsichtigte Funktionslogik des Vertrags zu beeinträchtigen.

Gibt es finanzielle Unterstützung für Forscher, die diese Tools nutzen? OpenAI stellt API-Gutschriften in Höhe von 10 Millionen US-Dollar zur Verfügung, um defensive Cybersicherheitsforschung zu unterstützen.