При поддержке
News

Предварительный обзор Claude Mythos: невыпущенный ИИ от Anthropic обнаружил в Linux и OpenBSD уязвимости, которые люди упускали из виду на протяжении десятилетий

Невыпущенная версия Claude Mythos Preview от Anthropic самостоятельно выявила тысячи уязвимостей «нулевого дня» высокой степени опасности во всех основных операционных системах и веб-браузерах, что побудило компанию запустить Project Glasswing — оборонительную коалицию по кибербезопасности, подкрепленную кредитами на использование ИИ на сумму до 100 миллионов долларов.

АВТОР
ПОДЕЛИТЬСЯ
Предварительный обзор Claude Mythos: невыпущенный ИИ от Anthropic обнаружил в Linux и OpenBSD уязвимости, которые люди упускали из виду на протяжении десятилетий

Основные выводы:

  • Claude Mythos Preview от Anthropic набрал 83,1% в тесте Cybergym, обнаружив тысячи уязвимостей «нулевого дня» во всех основных ОС и браузерах.
  • Проект Glasswing был запущен 7 апреля 2026 года с участием 11 партнеров-учредителей и кредитами на использование Mythos для защитников на сумму до 100 миллионов долларов.
  • 27-летняя уязвимость OpenBSD и 16-летняя ошибка FFmpeg выдержали миллионы автоматических тестов, пока Mythos не обнаружил их за несколько часов.

ИИ Claude Mythos набрал 83% в Cybergym и обнаружил критические уязвимости во всех основных браузерах и ОС

Модель, которую Anthropic описывает как крупнейший прирост возможностей одной модели в истории передового ИИ, завершила обучение и была публично анонсирована 7 апреля 2026 года после того, как в конце марта стали известны внутренние детали из-за неправильно настроенной системы управления контентом, которая раскрыла примерно 3000 внутренних файлов.

Anthropic не выпускает Claude Mythos Preview для общественности или через свой общий API. Компания ограничила доступ к проверенной группе партнеров после того, как модель продемонстрировала, что может обнаруживать и использовать неизвестные ранее уязвимости программного обеспечения со скоростью и в масштабах, превосходящих как человеческих экспертов, так и предыдущие системы ИИ.

Что касается тестов по кибербезопасности, разрыв между Mythos и Claude Opus 4.6 трудно игнорировать. Mythos набрал 83,1% в Cybergym против 66,6% у Opus 4.6, и 93,9% против 80,8% в SWE-bench Verified. В тесте SWE-bench Pro она набрала 77,8% против 53,4% — разница в 24 пункта. В тесте Humanity's Last Exam без использования инструментов она набрала 56,8%, по сравнению с 40,0% у своей предшественницы.

Модель не нуждается в специальном обучении по кибербезопасности, чтобы находить эти ошибки. Ее преимущества обусловлены более широкими достижениями в области рассуждений, многоэтапного планирования и автономного агентского поведения. Получив целевую кодовую базу в изолированном контейнере, она читает исходный код, формирует гипотезы о недостатках безопасности памяти, компилирует и запускает программное обеспечение, использует отладчики, такие как Address Sanitizer, ранжирует файлы по вероятности уязвимости и генерирует проверенные отчеты об ошибках с работающими эксплойтами для подтверждения концепции.

Некоторые из этих эксплойтов практически не требовали участия человека. Tomshardware.com сообщает, что 27-летняя уязвимость OpenBSD TCP SACK — тонкий переполнение целого числа, позволяющий злоумышленнику удаленно вызвать сбой любого отвечающего хоста путем создания вредоносных пакетов — была обнаружена автономно после примерно 1000 прогонов с общими затратами менее 20 000 долларов. 16-летняя ошибка FFmpeg H.264 прошла более пяти миллионов автоматических тестов и несколько аудитов, прежде чем Mythos ее обнаружил.

Особое внимание привлекли результаты тестирования браузеров. При тестировании движка JavaScript в Firefox 147 Mythos обнаружил 181 эксплойт с полным доступом к оболочке и 29 случаев контроля регистров. Claude Opus 4.6 обнаружил два эксплойта с доступом к оболочке в том же наборе тестов. Модель также построила работающие цепочки повышения привилегий ядра Linux, от пользователя до root на серверах, после фильтрации 100 недавних CVE до 40 подходящих кандидатов и успешного использования более половины из них.

Человеческие валидаторы рассмотрели 198 отчетов о уязвимостях, сгенерированных моделью, и согласились с ее оценками серьезности в 89% случаев, при этом в 98% случаев согласие было в пределах одного уровня серьезности.

Проект Glasswing

На данный момент менее 1% выявленных ошибок были полностью исправлены. Anthropic координирует ответственное раскрытие информации, публикуя криптографические обязательства SHA-3 для незакрытых проблем и соблюдая график «90 плюс 45 дней» перед публикацией полных деталей. Ошибка удаленного выполнения кода на сервере NFS FreeBSD CVE-2026-4747, существующая уже 17 лет и предоставляющая полный неавторизованный root-доступ, входит в число названных примеров, информация о которых уже раскрыта.

Claude Mythos Preview: Anthropic's Unreleased AI Cracked Linux and OpenBSD Bugs Humans Missed for Decades

Проект Glasswing, объявленный одновременно с моделью, представляет собой попытку Anthropic направить эти возможности на защиту, прежде чем подобные инструменты станут широко доступными. В число партнеров-учредителей входят Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia и Palo Alto Networks. Доступ расширяется для более чем 40 дополнительных организаций, занимающихся критически важным программным обеспечением.

Anthropic выделила 4 миллиона долларов на пожертвования в области безопасности с открытым исходным кодом: 2,5 миллиона долларов для Alpha-Omega через OpenSSF посредством Linux Foundation и 1,5 миллиона долларов для Apache Software Foundation.

Компания Anthropic зарегистрировала фонд AnthroPAC в Федеральной избирательной комиссии на фоне спора с Пентагоном

Компания Anthropic зарегистрировала фонд AnthroPAC в Федеральной избирательной комиссии на фоне спора с Пентагоном

3 апреля 2026 года компания Anthropic зарегистрировала в Федеральной избирательной комиссии (FEC) политический комитет AnthroPAC, создав свой первый комитет, финансируемый сотрудниками, в преддверии промежуточных выборов, посвященных вопросам искусственного интеллекта. read more.

Читать

Компания признала, что инструменты ИИ, такие как Mythos, снижают барьер для обнаружения и использования уязвимостей, и указала на краткосрочный риск со стороны государственных субъектов — Китая, Ирана, Северной Кореи и России — а также преступных группировок, если подобные возможности распространятся без контроля. Она описала период переходных потрясений, который наступит до того, как защитники полностью интегрируют эту технологию.

Anthropic заявила, что в предстоящих версиях Claude Opus будут включены меры безопасности для обнаружения и блокировки опасных результатов в области кибербезопасности, а также планирует ввести программу киберверификации для проверенных специалистов по безопасности. Публичный отчет о выводах партнеров и исправленных уязвимостях ожидается в течение 90 дней.