제공
News

클로드 미토스 미리보기: 앤트로픽의 미공개 AI, 수십 년간 인간들이 놓쳤던 리눅스와 오픈BSD의 취약점을 발견하다

Anthropic의 미출시 버전인 ‘Claude Mythos Preview’가 모든 주요 운영 체제와 웹 브라우저에서 수천 건의 고위험 제로데이 취약점을 자율적으로 식별해 내자, 회사는 최대 1억 달러 상당의 AI 사용 크레딧을 지원하는 방어적 사이버 보안 연합인 ‘프로젝트 글래스윙(Project Glasswing)’을 출범시켰다. 주요 내용:

작성자
공유
클로드 미토스 미리보기: 앤트로픽의 미공개 AI, 수십 년간 인간들이 놓쳤던 리눅스와 오픈BSD의 취약점을 발견하다
  • Anthropic의 Claude Mythos Preview는 Cybergym에서 83.1%의 점수를 기록하며 모든 주요 OS와 브라우저에서 수천 건의 제로데이 취약점을 발견했습니다.
  • 프로젝트 글래스윙은 2026년 4월 7일, 11개의 창립 파트너와 방어 담당자들을 위한 최대 1억 달러 규모의 미토스 사용 크레딧을 바탕으로 출범했습니다.
  • 27년 된 OpenBSD 결함과 16년 된 FFmpeg 버그는 수백만 건의 자동화된 테스트를 견뎌냈으나, 마이토스가 단 몇 시간 만에 이를 발견했습니다.

Claude Mythos AI, Cybergym에서 83% 점수 획득… 모든 주요 브라우저 및 OS에서 치명적 결함 발견

Anthropic이 최첨단 AI 역사상 단일 모델로서는 가장 큰 성능 향상을 이룬 것으로 묘사하는 이 모델은, 3월 말 잘못 구성된 콘텐츠 관리 시스템으로 인해 약 3,000개의 내부 파일이 노출되면서 내부 세부 정보가 유출된 후, 훈련을 완료하고 2026년 4월 7일 공식 발표되었습니다.

Anthropic은 Claude Mythos Preview를 일반 대중이나 일반 API를 통해 공개하지 않을 예정이다. 이 회사는 해당 모델이 이전에 알려지지 않은 소프트웨어 결함을 발견하고 악용할 수 있음을 입증한 후, 접근 권한을 선별된 파트너 그룹으로 제한했다. 이 모델은 그 속도와 규모 면에서 인간 전문가와 기존 AI 시스템을 모두 능가했다.

사이버 보안 벤치마크에서 Mythos와 Claude Opus 4.6 간의 격차는 무시하기 어렵습니다. Mythos는 Cybergym에서 83.1%를 기록한 반면 Opus 4.6은 66.6%를 기록했으며, SWE-bench Verified에서는 각각 93.9%와 80.8%를 기록했습니다. SWE-bench Pro에서는 77.8% 대 53.4%로 24%포인트 차이를 보였다. 도구 없이 'Humanity's Last Exam'에서 56.8%를 기록한 반면, 전작의 점수는 40.0%에 그쳤다. 이 모델은 이러한 버그를 발견하기 위해 사이버 보안 전용 훈련이 필요하지 않다. 이 모델의 성과는 추론, 다단계 계획 수립, 자율적 에이전트 행동에 대한 광범위한 발전에서 비롯됩니다. 격리된 컨테이너 내의 대상 코드베이스를 제공받으면, 소스 코드를 읽고 메모리 안전성 결함에 대한 가설을 수립한 뒤, 소프트웨어를 컴파일 및 실행하고, Address Sanitizer와 같은 디버거를 사용하여 취약성 발생 가능성을 기준으로 파일을 순위 매긴 후, 작동하는 개념 증명(PoC) 익스플로잇을 포함한 검증된 버그 보고서를 생성합니다.

이러한 익스플로잇 중 일부는 사람의 개입이 거의 필요하지 않았습니다. Tomshardware.com에 따르면, 공격자가 악성 패킷을 조작하여 응답하는 호스트를 원격으로 다운시킬 수 있는 미묘한 정수 오버플로우인 27년 된 OpenBSD TCP SACK 취약점이 약 1,000회의 실행 끝에 총 2만 달러 미만의 비용으로 자율적으로 발견되었습니다. 16년 된 FFmpeg H.264 버그는 500만 건 이상의 자동화된 테스트와 여러 차례의 감사를 거쳤음에도 Mythos가 발견하기 전까지 남아 있었습니다. 브라우저 테스트 결과는 특히 주목을 받았습니다. Firefox 147의 JavaScript 엔진 테스트에서 Mythos는 181개의 완전한 셸 익스플로잇과 29건의 레지스터 제어 사례를 생성했습니다. Claude Opus 4.6은 동일한 테스트 세트에서 2개의 셸 익스플로잇을 생성했습니다. 또한 이 모델은 최근 CVE 100건을 필터링해 악용 가능한 후보 40개로 좁힌 뒤 그중 절반 이상을 성공적으로 악용해 서버에서 사용자 권한을 루트 권한으로 상승시키는 작동 가능한 리눅스 커널 권한 상승 체인을 구축했습니다. 인간 검증자가 모델의 취약점 보고서 198건을 검토한 결과, 심각도 등급에 대해 89%의 일치율을 보였으며 1단계 이내의 심각도 등급에서는 98%의 일치율을 기록했습니다.

프로젝트 글래스윙

현재까지 식별된 버그 중 1% 미만이 완전히 패치되었습니다. Anthropic은 책임 있는 공개(Responsible Disclosure)를 조정하고 있으며, 패치되지 않은 문제에 대해 암호화 SHA-3 서약을 공개하고, 전체 세부 정보를 공개하기 전 90일+45일의 일정을 준수하고 있습니다. 인증 없이 완전한 루트 권한을 부여하는 17년 된 FreeBSD NFS 서버 원격 코드 실행 버그 CVE-2026-4747은 이미 공개된 사례 중 하나입니다.

Claude Mythos Preview: Anthropic's Unreleased AI Cracked Linux and OpenBSD Bugs Humans Missed for Decades

이 모델과 함께 발표된 ‘프로젝트 글래스윙(Project Glasswing)’은 유사한 도구가 널리 보급되기 전에 이러한 역량을 방어 목적으로 활용하려는 Anthropic의 시도입니다. 창립 파트너로는 Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks 등이 포함됩니다. 접근 권한은 40개 이상의 주요 소프트웨어 조직으로 확대되고 있습니다.

Anthropic은 오픈소스 보안 기금으로 400만 달러를 기부하기로 약속했다. 이 중 250만 달러는 리눅스 재단을 통해 OpenSSF의 알파-오메가(Alpha-Omega) 프로젝트에, 150만 달러는 아파치 소프트웨어 재단에 기부된다.

앤트로픽, 국방부와의 분쟁 속 연방선거위원회에 앤트로팩 등록

앤트로픽, 국방부와의 분쟁 속 연방선거위원회에 앤트로팩 등록

앤트로픽은 2026년 4월 3일 연방선거위원회(FEC)에 ‘앤트로팩(AnthroPAC)’을 등록하며, 인공지능(AI)을 주요 쟁점으로 삼은 중간선거를 앞두고 첫 직원 후원 정치활동위원회(PAC)를 설립했다. read more.

지금 읽기

이 회사는 Mythos와 같은 AI 도구가 취약점을 발견하고 악용하는 장벽을 낮춘다는 점을 인정했으며, 유사한 기능이 통제 없이 확산될 경우 국가 행위자(중국, 이란, 북한, 러시아) 및 범죄 조직으로부터의 단기적 위험을 경고했다. 또한 방어 측이 이 기술을 완전히 통합하기 전까지 과도기적 혼란의 시기가 있을 것이라고 설명했다.

Anthropic은 향후 출시될 Claude Opus 버전에 위험한 사이버 보안 출력을 탐지하고 차단하는 안전 장치를 포함할 것이며, 검증된 보안 전문가를 위한 '사이버 검증 프로그램(Cyber Verification Program)'을 도입할 계획이라고 밝혔다. 파트너사의 조사 결과 및 패치된 취약점에 대한 공개 보고서는 90일 이내에 발표될 예정이다.