Aangedreven door
News

Vooruitblik op Claude Mythos: de nog niet uitgebrachte AI van Anthropic heeft bugs in Linux en OpenBSD ontdekt die mensen decennialang over het hoofd hebben gezien

De nog niet uitgebrachte Claude Mythos Preview van Anthropic heeft zelfstandig duizenden zero-day-kwetsbaarheden met een hoge ernstgraad ontdekt in alle gangbare besturingssystemen en webbrowsers. Dit heeft het bedrijf ertoe aangezet om Project Glasswing te lanceren, een defensieve cyberbeveiligingscoalitie die wordt ondersteund met tot wel 100 miljoen dollar aan AI-gebruikscredits.

GESCHREVEN DOOR
DELEN
Vooruitblik op Claude Mythos: de nog niet uitgebrachte AI van Anthropic heeft bugs in Linux en OpenBSD ontdekt die mensen decennialang over het hoofd hebben gezien

Belangrijkste conclusies:

  • Anthropic's Claude Mythos Preview scoorde 83,1% op Cybergym en vond duizenden zero-days in alle grote besturingssystemen en browsers.
  • Project Glasswing werd op 7 april 2026 gelanceerd, met 11 oprichtende partners en tot 100 miljoen dollar aan Mythos-gebruikscredits voor verdedigers.
  • Een 27 jaar oude OpenBSD-kwetsbaarheid en een 16 jaar oude FFmpeg-bug doorstonden miljoenen geautomatiseerde tests, totdat Mythos ze binnen enkele uren ontdekte.

Claude Mythos AI scoorde 83% op Cybergym en vond kritieke kwetsbaarheden in alle grote browsers en besturingssystemen

Het model, dat door Anthropic wordt omschreven als de grootste capaciteitswinst voor een enkel model in de geschiedenis van grensverleggende AI, voltooide de training en werd op 7 april 2026 publiekelijk aangekondigd, nadat eind maart interne details aan het licht waren gekomen via een verkeerd geconfigureerd contentmanagementsysteem dat ongeveer 3.000 interne bestanden blootlegde.

Anthropic stelt de Claude Mythos Preview niet openbaar beschikbaar of via zijn algemene API. Het bedrijf beperkte de toegang tot een geselecteerde groep partners nadat het model had aangetoond dat het onbekende softwarefouten kon ontdekken en misbruiken met een snelheid en schaal die zowel menselijke experts als eerdere AI-systemen overtreffen.

Wat betreft cyberbeveiligingsbenchmarks is het verschil tussen Mythos en Claude Opus 4.6 moeilijk te negeren. Mythos scoorde 83,1% op Cybergym tegenover 66,6% voor Opus 4.6, en 93,9% tegenover 80,8% op SWE-bench Verified. Op SWE-bench Pro behaalde het 77,8% tegenover 53,4% – een verschil van 24 punten. Het haalde 56,8% op Humanity's Last Exam zonder hulpmiddelen, vergeleken met 40,0% voor zijn voorganger.

Het model heeft geen specifieke cyberbeveiligingstraining nodig om deze bugs te vinden. De verbeteringen zijn te danken aan bredere vooruitgang op het gebied van redeneren, planning in meerdere stappen en autonoom agentgedrag. Gegeven een doelcodebase in een geïsoleerde container, leest het de broncode, vormt het hypothesen over fouten in de geheugenveiligheid, compileert en voert het de software uit, gebruikt het debuggers zoals Address Sanitizer, rangschikt het bestanden op basis van de waarschijnlijkheid van kwetsbaarheid en produceert het gevalideerde bugrapporten met werkende proof-of-concept-exploits.

Sommige van die exploits vereisten vrijwel geen menselijke begeleiding. Tomshardware.com meldt dat een 27 jaar oude OpenBSD TCP SACK-kwetsbaarheid, een subtiele integer-overflow waarmee een aanvaller op afstand elke reagerende host kan laten crashen door kwaadaardige pakketten te vervaardigen, autonoom werd gevonden na ongeveer 1.000 runs tegen totale kosten van minder dan $ 20.000. Een 16 jaar oude FFmpeg H.264-bug overleefde meer dan vijf miljoen geautomatiseerde tests en meerdere audits voordat Mythos deze ontdekte.

De resultaten voor browsers trokken bijzondere aandacht. Bij het testen van de JavaScript-engine van Firefox 147 produceerde Mythos 181 volledige shell-exploits en 29 gevallen van registercontrole. Claude Opus 4.6 produceerde twee shell-exploits in dezelfde testset. Het model bouwde ook werkende Linux-kernel-privilege-escalatieketens, van gebruiker naar root op servers, na 100 recente CVE's te hebben gefilterd tot 40 exploiteerbare kandidaten en meer dan de helft daarvan met succes te hebben geëxploiteerd.

Menselijke validators beoordeelden 198 van de kwetsbaarheidsrapporten van het model en waren het in 89% van de gevallen eens met de ernstbeoordelingen, met 98% overeenstemming binnen één ernstniveau.

Project Glasswing

Minder dan 1% van de geïdentificeerde bugs is tot nu toe volledig gepatcht. Anthropic coördineert verantwoorde openbaarmaking, publiceert cryptografische SHA-3-toezeggingen voor niet-gepatchte problemen en volgt een tijdschema van 90 plus 45 dagen voordat volledige details worden vrijgegeven. De FreeBSD NFS-server bug voor uitvoering van externe code CVE-2026-4747, 17 jaar oud, die volledige niet-geverifieerde root-toegang verleent, behoort tot de genoemde voorbeelden die al openbaar zijn gemaakt.

Claude Mythos Preview: Anthropic's Unreleased AI Cracked Linux and OpenBSD Bugs Humans Missed for Decades

Project Glasswing, dat samen met het model werd aangekondigd, is een poging van Anthropic om deze mogelijkheden in te zetten voor defensiedoeleinden voordat soortgelijke tools op grote schaal beschikbaar komen. Tot de oprichtende partners behoren Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, de Linux Foundation, Microsoft, Nvidia en Palo Alto Networks. De toegang wordt uitgebreid naar meer dan 40 andere kritieke softwareorganisaties.

Anthropic heeft 4 miljoen dollar toegezegd aan donaties voor open-sourcebeveiliging: 2,5 miljoen dollar aan Alpha-Omega via de OpenSSF via de Linux Foundation, en 1,5 miljoen dollar aan de Apache Software Foundation.

Anthropic registreert AnthroPAC bij de FEC te midden van een geschil met het Pentagon

Anthropic registreert AnthroPAC bij de FEC te midden van een geschil met het Pentagon

Anthropic heeft op 3 april 2026 AnthroPAC bij de FEC geregistreerd, waarmee het zijn eerste door werknemers gefinancierde PAC heeft opgericht in de aanloop naar de tussentijdse verkiezingen, die in het teken staan van kunstmatige intelligentie. read more.

Lees nu

Het bedrijf erkende dat AI-tools zoals Mythos de drempel verlagen voor het opsporen en misbruiken van kwetsbaarheden, en wees op risico's op korte termijn van staatsactoren, China, Iran, Noord-Korea en Rusland, en criminele groeperingen als soortgelijke mogelijkheden zich ongecontroleerd verspreiden. Het beschreef een periode van overgangsturbulentie voordat verdedigers de technologie volledig integreren.

Anthropic zei dat aankomende releases van Claude Opus beveiligingsmaatregelen zullen bevatten om gevaarlijke cyberbeveiligingsuitkomsten te detecteren en te blokkeren, en is van plan een Cyber Verification Program in te voeren voor gescreende beveiligingsprofessionals. Een openbaar rapport over de bevindingen van partners en gepatchte kwetsbaarheden wordt binnen 90 dagen verwacht.