За підтримки
News

Попередній огляд Claude Mythos: невипущена система штучного інтелекту від Anthropic виявила вразливості в Linux та OpenBSD, які люди не помічали протягом десятиліть

Неопублікована версія Claude Mythos Preview від Anthropic самостійно виявила тисячі вразливостей «нульового дня» високого рівня небезпеки у всіх основних операційних системах та веб-браузерах, що спонукало компанію запустити Project Glasswing — оборонну коаліцію з кібербезпеки, підтриману кредитами на використання штучного інтелекту на суму до 100 мільйонів доларів.

АВТОР
ПОДІЛИТИСЯ
Попередній огляд Claude Mythos: невипущена система штучного інтелекту від Anthropic виявила вразливості в Linux та OpenBSD, які люди не помічали протягом десятиліть

Основні висновки:

  • Claude Mythos Preview від Anthropic набрав 83,1% на Cybergym, виявивши тисячі уразливостей «нульового дня» у всіх основних ОС та браузерах.
  • Проект Glasswing стартував 7 квітня 2026 року з 11 партнерами-засновниками та кредитами на використання Mythos для захисників на суму до 100 мільйонів доларів.
  • 27-річна вразливість OpenBSD та 16-річна помилка FFmpeg витримали мільйони автоматизованих тестів, поки Mythos не виявив їх за лічені години.

Штучний інтелект Claude Mythos набрав 83% на Cybergym і виявив критичні уразливості у всіх основних браузерах та ОС

Модель, яку Anthropic описує як найбільший приріст можливостей однієї моделі в історії передової штучного інтелекту, завершила навчання і була публічно анонсована 7 квітня 2026 року, після того як наприкінці березня з’явилися внутрішні деталі через неправильно налаштовану систему управління контентом, яка оприлюднила приблизно 3 000 внутрішніх файлів.

Anthropic не випускає Claude Mythos Preview для широкої публіки або через свій загальний API. Компанія обмежила доступ до перевіреної групи партнерів після того, як модель продемонструвала, що може виявляти та експлуатувати невідомі раніше програмні вразливості зі швидкістю та масштабом, що перевершують як людських експертів, так і попередні системи штучного інтелекту.

Щодо тестів з кібербезпеки, розрив між Mythos і Claude Opus 4.6 важко ігнорувати. Mythos набрав 83,1% на Cybergym проти 66,6% у Opus 4.6, а також 93,9% проти 80,8% на SWE-bench Verified. У тесті SWE-bench Pro вона набрала 77,8% проти 53,4% — різниця у 24 пункти. У тесті Humanity's Last Exam без використання інструментів вона набрала 56,8%, порівняно з 40,0% у попередньої версії.

Модель не потребує спеціального навчання з кібербезпеки, щоб виявляти ці помилки. Її переваги походять від більш широких досягнень у міркуванні, багатоетапному плануванні та автономній поведінці агента. Отримавши цільову кодову базу в ізольованому контейнері, вона читає вихідний код, формує гіпотези щодо недоліків безпеки пам'яті, компілює та запускає програмне забезпечення, використовує дебагери, такі як Address Sanitizer, ранжує файли за ймовірністю вразливості та створює перевірені звіти про помилки з робочими експлойтами для підтвердження концепції.

Деякі з цих експлойтів майже не потребували втручання людини. Tomshardware.com повідомляє, що 27-річна вразливість OpenBSD TCP SACK — тонкий переповнення цілого числа, що дозволяє зловмиснику віддалено вивести з ладу будь-який хост, що відповідає, шляхом створення шкідливих пакетів, — була виявлена автономно після приблизно 1 000 запусків із загальною вартістю менше 20 000 доларів. 16-річна помилка FFmpeg H.264 витримала понад п’ять мільйонів автоматизованих тестів та численні аудити, перш ніж Mythos її виявив.

Особливу увагу привернули результати тестування браузерів. Під час тестування JavaScript-двигуна Firefox 147 Mythos виявив 181 експлойт із повним доступом до оболонки та 29 випадків контролю регістрів. Claude Opus 4.6 виявив два експлойти з доступом до оболонки в тому ж наборі тестів. Модель також побудувала робочі ланцюжки підвищення привілеїв ядра Linux, від користувача до root на серверах, після фільтрації 100 останніх CVE до 40 експлойтів, що піддаються експлуатації, та успішної експлуатації більше половини з них.

Людські валідатори перевірили 198 звітів про вразливості, згенерованих моделлю, і погодилися з її оцінками серйозності у 89% випадків, причому у 98% випадків збігся рівень серйозності.

Проект Glasswing

Наразі менше 1% виявлених помилок було повністю виправлено. Anthropic координує відповідальне розкриття інформації, публікуючи криптографічні зобов'язання SHA-3 щодо невиправлених проблем та дотримуючись графіка «90 плюс 45 днів» перед оприлюдненням повних деталей. Помилка віддаленого виконання коду на сервері NFS FreeBSD CVE-2026-4747, якій вже 17 років і яка надає повний неавторизований доступ root, є одним із названих прикладів, що вже оприлюднені.

Claude Mythos Preview: Anthropic's Unreleased AI Cracked Linux and OpenBSD Bugs Humans Missed for Decades

Проект Glasswing, оголошений разом із моделлю, є спробою Anthropic спрямувати ці можливості на захист, перш ніж подібні інструменти стануть широко доступними. Серед партнерів-засновників — Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia та Palo Alto Networks. Доступ розширюється на понад 40 додаткових організацій, що розробляють критично важливе програмне забезпечення.

Anthropic виділила 4 мільйони доларів на пожертви на безпеку відкритого програмного забезпечення: 2,5 мільйона доларів для Alpha-Omega через OpenSSF за посередництва Linux Foundation та 1,5 мільйона доларів для Apache Software Foundation.

Компанія Anthropic зареєструвала AnthroPAC у Федеральній виборчій комісії на тлі суперечки з Пентагоном

Компанія Anthropic зареєструвала AnthroPAC у Федеральній виборчій комісії на тлі суперечки з Пентагоном

3 квітня 2026 року компанія Anthropic зареєструвала в Федеральній виборчій комісії (FEC) організацію AnthroPAC, створивши свій перший політичний комітет, що фінансується співробітниками, напередодні проміжних виборів, присвячених темі штучного інтелекту. read more.

Читати

Компанія визнала, що інструменти штучного інтелекту, такі як Mythos, знижують бар'єр для виявлення та експлуатації вразливостей, і вказала на короткостроковий ризик з боку державних суб'єктів, Китаю, Ірану, Північної Кореї та Росії, а також злочинних угруповань, якщо подібні можливості поширяться без контролю. Вона описала період перехідних потрясінь, перш ніж захисники повністю інтегрують цю технологію.

Anthropic заявила, що майбутні версії Claude Opus міститимуть засоби захисту для виявлення та блокування небезпечних результатів у сфері кібербезпеки, а також планує запровадити програму кіберверифікації для перевірених фахівців з безпеки. Публічний звіт про висновки партнерів та виправлені вразливості очікується протягом 90 днів.