Poháňa
News

Ukážka hry Claude Mythos: Nevydaná umelá inteligencia spoločnosti Anthropic odhalila chyby v systémoch Linux a OpenBSD, ktoré ľuďom unikali celé desaťročia

Nevydaná verzia Claude Mythos Preview od spoločnosti Anthropic autonómne identifikovala tisíce závažných zraniteľností typu zero-day vo všetkých hlavných operačných systémoch a webových prehliadačoch, čo podnietilo spoločnosť k spusteniu projektu Glasswing – obrannej koalície v oblasti kyberbezpečnosti, ktorú podporujú kredity na využívanie umelej inteligencie v hodnote až 100 miliónov dolárov.

NAPÍSAL
ZDIEĽAŤ
Ukážka hry Claude Mythos: Nevydaná umelá inteligencia spoločnosti Anthropic odhalila chyby v systémoch Linux a OpenBSD, ktoré ľuďom unikali celé desaťročia

Kľúčové zistenia:

  • Nástroj Claude Mythos Preview od spoločnosti Anthropic dosiahol v teste Cybergym skóre 83,1 % a odhalil tisíce zraniteľností typu zero-day vo všetkých hlavných operačných systémoch a prehliadačoch.
  • Projekt Glasswing bol spustený 7. apríla 2026 s 11 zakladajúcimi partnermi a kreditmi na využívanie Mythosu v hodnote až 100 miliónov dolárov pre obrancov.
  • 27-ročná chyba v OpenBSD a 16-ročná chyba v FFmpeg prežili milióny automatizovaných testov, kým ich Mythos nezistil za pár hodín.

Claude Mythos AI dosiahol v Cybergym skóre 83 % a odhalil kritické chyby vo všetkých hlavných prehliadačoch a operačných systémoch

Model, ktorý spoločnosť Anthropic opisuje ako najväčší nárast schopností jediného modelu v histórii špičkovej umelej inteligencie, dokončil tréning a bol verejne oznámený 7. apríla 2026, potom, čo sa koncom marca objavili interné detaily prostredníctvom nesprávne nakonfigurovaného systému správy obsahu, ktorý odhalil približne 3 000 interných súborov.

Spoločnosť Anthropic nezverejňuje náhľad na model Claude Mythos verejnosti ani prostredníctvom svojho všeobecného API. Spoločnosť obmedzila prístup na overenú skupinu partnerov po tom, čo model preukázal, že dokáže odhaľovať a zneužívať neznáme softvérové chyby rýchlosťou a v rozsahu, ktoré prevyšujú schopnosti ľudských expertov aj predchádzajúcich systémov umelej inteligencie.

Pokiaľ ide o benchmarky kyberbezpečnosti, rozdiel medzi Mythosom a Claude Opus 4.6 je ťažké prehliadnuť. Mythos dosiahol v Cybergym skóre 83,1 % oproti 66,6 % pre Opus 4.6 a 93,9 % oproti 80,8 % v SWE-bench Verified. V teste SWE-bench Pro dosiahol 77,8 % oproti 53,4 % – rozdiel 24 bodov. V teste Humanity's Last Exam bez nástrojov dosiahol 56,8 %, v porovnaní s 40,0 % u svojho predchodcu.

Model nepotrebuje špecifické školenie v oblasti kyberbezpečnosti, aby tieto chyby našiel. Jeho úspechy vyplývajú zo širších pokrokov v oblasti uvažovania, viacstupňového plánovania a autonómneho agentného správania. Ak má k dispozícii cieľovú kódovú základňu v izolovanom kontajneri, prečíta zdrojový kód, vytvorí hypotézy o chybách v bezpečnosti pamäte, skompiluje a spustí softvér, použije debuggery ako Address Sanitizer, zoradí súbory podľa pravdepodobnosti zraniteľnosti a vygeneruje overené správy o chybách s fungujúcimi exploitmi na overenie konceptu.

Niektoré z týchto exploitov nevyžadovali takmer žiadne ľudské zásahy. Tomshardware.com uvádza, že 27 rokov stará zraniteľnosť OpenBSD TCP SACK, subtílny pretečenie celočíselnej premennej, ktorá umožňuje útočníkovi vzdialene spôsobiť zlyhanie akéhokoľvek odpovedajúceho hostiteľa vytvorením škodlivých paketov, bola nájdená autonómne po približne 1 000 behov s celkovými nákladmi pod 20 000 USD. 16-ročná chyba FFmpeg H.264 prežila viac ako päť miliónov automatizovaných testov a viacero auditov, kým ju Mythos nezachytil.

Výsledky prehliadačov vzbudili osobitnú pozornosť. Pri testovaní JavaScriptového enginu vo Firefoxe 147 vytvoril Mythos 181 exploitov s plným shellom a 29 prípadov ovládania registrov. Claude Opus 4.6 vytvoril dva exploity so shellom v rámci tej istej testovacej sady. Model tiež vytvoril fungujúce reťazce na eskaláciu oprávnení v jadre Linuxu, od používateľa po root na serveroch, po tom, čo filtroval 100 nedávnych CVE na 40 zneužiteľných kandidátov a úspešne zneužil viac ako polovicu z nich.

Ľudskí validátori preskúmali 198 správ o zraniteľnostiach modelu a v 89 % prípadov súhlasili s jeho hodnotením závažnosti, pričom v 98 % prípadov sa zhodli v rámci jednej úrovne závažnosti.

Projekt Glasswing

Menej ako 1 % identifikovaných chýb bolo doteraz úplne opravených. Spoločnosť Anthropic koordinuje zodpovedné zverejňovanie, uverejňuje kryptografické záväzky SHA-3 pre neopravené problémy a dodržiava časový harmonogram 90 plus 45 dní pred zverejnením úplných podrobností. Chyba vzdialeného spustenia kódu na serveri FreeBSD NFS CVE-2026-4747, stará 17 rokov, ktorá poskytuje plný neautentizovaný prístup s oprávneniami root, patrí medzi uvedené príklady, ktoré už boli zverejnené.

Claude Mythos Preview: Anthropic's Unreleased AI Cracked Linux and OpenBSD Bugs Humans Missed for Decades

Projekt Glasswing, oznámený spolu s modelom, je pokusom spoločnosti Anthropic nasmerovať tieto schopnosti na obranu skôr, ako sa podobné nástroje stanú široko dostupnými. Medzi zakladajúcich partnerov patria Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia a Palo Alto Networks. Prístup sa rozširuje na viac ako 40 ďalších organizácií zaoberajúcich sa kritickým softvérom.

Spoločnosť Anthropic sa zaviazala venovať 4 milióny dolárov na darcovstvo v oblasti bezpečnosti open-source: 2,5 milióna dolárov pre Alpha-Omega prostredníctvom OpenSSF cez Linux Foundation a 1,5 milióna dolárov pre Apache Software Foundation.

Spoločnosť Anthropic zaregistrovala organizáciu AnthroPAC vo Federálnej volebnej komisii uprostred sporu s Pentagonom

Spoločnosť Anthropic zaregistrovala organizáciu AnthroPAC vo Federálnej volebnej komisii uprostred sporu s Pentagonom

Spoločnosť Anthropic zaregistrovala 3. apríla 2026 pri Federálnej volebnej komisii (FEC) organizáciu AnthroPAC, čím vytvorila svoj prvý politický akčný výbor financovaný zamestnancami v predvečer doplňujúcich volieb zameraných na umelú inteligenciu. read more.

Čítať teraz

Spoločnosť uznala, že nástroje umelej inteligencie, ako je Mythos, znižujú bariéru pri hľadaní a zneužívaní zraniteľností, a upozornila na krátkodobé riziko zo strany štátnych aktérov, Číny, Iránu, Severnej Kórey a Ruska, ako aj zločineckých skupín, ak sa podobné schopnosti rozšíria bez kontroly. Opísala obdobie prechodných nepokojov, kým obrancovia túto technológiu plne integrujú.

Spoločnosť Anthropic uviedla, že nadchádzajúce verzie Claude Opus budú obsahovať bezpečnostné opatrenia na detekciu a blokovanie nebezpečných výstupov v oblasti kyberbezpečnosti a plánuje zaviesť program Cyber Verification Program pre overených bezpečnostných odborníkov. Verejná správa o zisteniach partnerov a opravených zraniteľnostiach sa očakáva do 90 dní.