Aangedreven door
News Bytes

OpenAI en Paradigm lanceren EVMbench om de beveiliging van AI-smart contracts te meten

OpenAI en Paradigm hebben EVMbench geïntroduceerd, een nieuw benchmarkframework dat is ontworpen om het vermogen van AI-agenten te evalueren om blockchainkwetsbaarheden te detecteren, te patchen en uit te buiten.

GESCHREVEN DOOR
DELEN
OpenAI en Paradigm lanceren EVMbench om de beveiliging van AI-smart contracts te meten

OpenAI en Paradigm hebben EVMbench officieel gelanceerd om beveiligingsrisico’s in smart contracts aan te pakken die meer dan $100 miljard aan crypto-activa beveiligen. De benchmark maakt gebruik van 120 samengestelde kwetsbaarheden uit 40 professionele audits, waaronder scenario’s van de Tempo-blockchain, om de capaciteiten van Kunstmatige Intelligentie (AI) te testen in een gesandboxte Ethereum Virtual Machine (EVM)-omgeving.

Het systeem evalueert agenten in drie onderscheiden modi: detectie van kwetsbaarheden, functioneel patchen van code en end-to-end uitvoering van exploits die fondsen leegtrekken. Recente tests tonen aan dat het model GPT-5.3-Codex een slagingspercentage van 72,2% behaalt bij exploit-taken, wat een aanzienlijke toename markeert ten opzichte van de score van 31,9% die GPT-5 slechts zes maanden geleden noteerde.

“Het meten van modelcapaciteit in dit domein helpt opkomende cyberrisico’s te volgen en benadrukt het belang van het defensief inzetten van AI-systemen om gedeployde contracten te auditen en te versterken,” aldus de aankondiging van OpenAI.

Rapport: Stripe en Paradigm's Blockchain Tempo Behaalt $500M Ondersteuning Van Thrive, Greenoaks

Rapport: Stripe en Paradigm's Blockchain Tempo Behaalt $500M Ondersteuning Van Thrive, Greenoaks

Ontdek de impact van Stripe's steun terwijl Tempo zijn Series A-ronde van $500 miljoen afsluit om de blockchain-betalingsinfrastructuur te verbeteren. read more.

Lees nu

🧭 Veelgestelde vragen

Wat is het primaire doel van het EVMbench-framework? Het meet hoe effectief AI-agenten smart contract-kwetsbaarheden met een hoge ernst identificeren en oplossen.

Welke organisaties werkten samen om deze nieuwe security-benchmark te ontwikkelen? OpenAI en de crypto-investeringsfirma Paradigm hebben samen de EVMbench-testomgeving ontwikkeld.

Hoe verifieert het systeem of een agent code succesvol patcht? Geautomatiseerde tests zorgen ervoor dat kwetsbaarheden worden geëlimineerd zonder de beoogde functionele logica van het contract te doorbreken.

Is er financiële ondersteuning beschikbaar voor onderzoekers die deze tools gebruiken? OpenAI stelt $10 miljoen aan API-credits beschikbaar ter ondersteuning van defensief cybersecurity-onderzoek.

Bitcoin Gaming Picks

100% Bonus tot 1 BTC + 10% Wekelijkse Inzetvrije Cashback

100% Bonus Tot 1 BTC + 10% Wekelijkse Cashback

130% tot 2.500 USDT + 200 Gratis Spins + 20% Wekelijkse Inzetvrije Cashback

1000% Welkomstbonus + Gratis Weddenschap tot 1 BTC

Tot 2.500 USDT + 150 Gratis Spins + Tot 30% Rakeback

470% Bonus tot $500.000 + 400 Gratis Spins + 20% Rakeback

3,5% Rakeback op Elke Weddenschap + Wekelijkse Verlotingen

425% tot 5 BTC + 100 Gratis Spins

100% tot $20K + Dagelijkse Rakeback