Được cung cấp bởi
News

Bản xem trước Claude Mythos: Hệ thống AI chưa ra mắt của Anthropic đã phát hiện ra các lỗ hổng trên Linux và OpenBSD mà con người đã bỏ qua trong nhiều thập kỷ

Phiên bản Claude Mythos Preview chưa được phát hành của Anthropic đã tự động phát hiện hàng nghìn lỗ hổng zero-day có mức độ nghiêm trọng cao trên mọi hệ điều hành và trình duyệt web chính, khiến công ty này quyết định khởi động Dự án Glasswing — một liên minh an ninh mạng phòng thủ được hỗ trợ bởi khoản tín dụng sử dụng AI trị giá lên đến 100 triệu USD.

TÁC GIẢ
CHIA SẺ
Bản xem trước Claude Mythos: Hệ thống AI chưa ra mắt của Anthropic đã phát hiện ra các lỗ hổng trên Linux và OpenBSD mà con người đã bỏ qua trong nhiều thập kỷ

Điểm chính:

  • Phiên bản Claude Mythos Preview của Anthropic đạt điểm 83,1% trên Cybergym, phát hiện hàng nghìn lỗ hổng zero-day trên mọi hệ điều hành và trình duyệt chính.
  • Dự án Glasswing ra mắt vào ngày 7 tháng 4 năm 2026, với 11 đối tác sáng lập và lên đến 100 triệu đô la tín dụng sử dụng Mythos dành cho các nhà bảo vệ.
  • Một lỗ hổng 27 năm tuổi trên OpenBSD và một lỗi 16 năm tuổi trên FFmpeg đã tồn tại qua hàng triệu bài kiểm tra tự động cho đến khi Mythos phát hiện chúng chỉ trong vài giờ.

Claude Mythos AI đạt 83% trên Cybergym và phát hiện các lỗ hổng nghiêm trọng trên mọi trình duyệt và hệ điều hành chính

Mô hình này, được Anthropic mô tả là sự gia tăng khả năng lớn nhất của một mô hình duy nhất trong lịch sử AI tiên phong, đã hoàn thành quá trình đào tạo và được công bố công khai vào ngày 7 tháng 4 năm 2026, sau khi các chi tiết nội bộ bị rò rỉ vào cuối tháng 3 thông qua một hệ thống quản lý nội dung được cấu hình sai, khiến khoảng 3.000 tệp nội bộ bị lộ.

Anthropic không phát hành bản xem trước Claude Mythos cho công chúng hoặc thông qua API chung. Công ty đã hạn chế quyền truy cập cho một nhóm đối tác được kiểm duyệt sau khi mô hình chứng minh có thể phát hiện và khai thác các lỗ hổng phần mềm chưa biết trước đây với tốc độ và quy mô vượt trội so với cả chuyên gia con người và các hệ thống AI trước đó.

Trên các tiêu chuẩn đánh giá an ninh mạng, khoảng cách giữa Mythos và Claude Opus 4.6 là điều khó có thể bỏ qua. Mythos đạt 83,1% trên Cybergym so với 66,6% của Opus 4.6, và 93,9% so với 80,8% trên SWE-bench Verified. Trên SWE-bench Pro, nó đạt 77,8% so với 53,4% — chênh lệch 24 điểm. Nó đạt 56,8% trên Humanity's Last Exam mà không cần công cụ, so với 40,0% của phiên bản tiền nhiệm.

Mô hình này không cần đào tạo chuyên biệt về an ninh mạng để phát hiện các lỗ hổng này. Sự tiến bộ của nó đến từ những bước tiến rộng hơn trong suy luận, lập kế hoạch nhiều bước và hành vi tự chủ của tác nhân. Khi được cung cấp một cơ sở mã nguồn mục tiêu trong một container cách ly, nó đọc mã nguồn, đưa ra giả thuyết về các lỗ hổng an toàn bộ nhớ, biên dịch và chạy phần mềm, sử dụng các công cụ gỡ lỗi như Address Sanitizer, xếp hạng các tệp theo khả năng xảy ra lỗ hổng và tạo ra các báo cáo lỗi đã được xác thực kèm theo các khai thác proof-of-concept hoạt động.

Một số khai thác trong số đó gần như không cần sự hướng dẫn của con người. Tomshardware.com báo cáo rằng một lỗ hổng OpenBSD TCP SACK tồn tại 27 năm, một lỗi tràn số nguyên tinh vi cho phép kẻ tấn công làm sập từ xa bất kỳ máy chủ nào đang phản hồi bằng cách tạo gói tin độc hại, đã được phát hiện tự động sau khoảng 1.000 lần chạy với tổng chi phí dưới $20.000. Một lỗ hổng FFmpeg H.264 tồn tại 16 năm đã vượt qua hơn năm triệu bài kiểm tra tự động và nhiều cuộc kiểm toán trước khi Mythos phát hiện ra nó.

Kết quả trên trình duyệt thu hút sự chú ý đặc biệt. Trong bài kiểm tra động cơ JavaScript của Firefox 147, Mythos tạo ra 181 mã khai thác shell đầy đủ và 29 trường hợp kiểm soát đăng ký. Claude Opus 4.6 tạo ra hai mã khai thác shell trên cùng bộ dữ liệu kiểm tra. Mô hình này cũng đã xây dựng các chuỗi leo thang đặc quyền nhân Linux hoạt động, từ người dùng lên root trên máy chủ, sau khi lọc 100 CVE gần đây xuống còn 40 ứng cử viên có thể khai thác và khai thác thành công hơn một nửa.

Các chuyên gia xác thực đã xem xét 198 báo cáo lỗ hổng của mô hình và đồng ý với mức độ nghiêm trọng của nó 89% số lần, với 98% đồng ý trong phạm vi một mức độ nghiêm trọng.

Dự án Glasswing

Cho đến nay, chưa đến 1% các lỗi được xác định đã được vá hoàn toàn. Anthropic đang phối hợp công bố có trách nhiệm, công bố các cam kết mã hóa SHA-3 cho các vấn đề chưa được vá, và tuân thủ khung thời gian 90 ngày cộng thêm 45 ngày trước khi công bố chi tiết đầy đủ. Lỗi thực thi mã từ xa trên máy chủ NFS của FreeBSD (CVE-2026-4747), đã tồn tại 17 năm, cho phép truy cập root không cần xác thực đầy đủ, là một trong những ví dụ được nêu tên đã được công bố.

Claude Mythos Preview: Anthropic's Unreleased AI Cracked Linux and OpenBSD Bugs Humans Missed for Decades

Dự án Glasswing, được công bố cùng với mô hình này, là nỗ lực của Anthropic nhằm hướng các khả năng này vào lĩnh vực quốc phòng trước khi các công cụ tương tự trở nên phổ biến. Các đối tác sáng lập bao gồm Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia và Palo Alto Networks. Quyền truy cập đang được mở rộng cho hơn 40 tổ chức phần mềm quan trọng khác.

Anthropic cam kết đóng góp 4 triệu USD cho các dự án bảo mật mã nguồn mở: 2,5 triệu USD cho Alpha-Omega thông qua OpenSSF dưới sự điều phối của Linux Foundation, và 1,5 triệu USD cho Apache Software Foundation.

Anthropic đăng ký AnthroPAC với Ủy ban Bầu cử Liên bang (FEC) trong bối cảnh tranh chấp với Lầu Năm Góc

Anthropic đăng ký AnthroPAC với Ủy ban Bầu cử Liên bang (FEC) trong bối cảnh tranh chấp với Lầu Năm Góc

Vào ngày 3 tháng 4 năm 2026, Anthropic đã đăng ký AnthroPAC với Ủy ban Bầu cử Liên bang (FEC), thành lập quỹ vận động chính trị (PAC) đầu tiên do nhân viên tài trợ trước thềm cuộc bầu cử… read more.

Đọc ngay

Công ty thừa nhận rằng các công cụ AI như Mythos làm giảm rào cản trong việc phát hiện và khai thác lỗ hổng, đồng thời cảnh báo về rủi ro ngắn hạn từ các thực thể nhà nước như Trung Quốc, Iran, Triều Tiên và Nga, cũng như các nhóm tội phạm nếu các khả năng tương tự lan rộng mà không có kiểm soát. Công ty mô tả một giai đoạn hỗn loạn chuyển tiếp trước khi các bên bảo vệ tích hợp hoàn toàn công nghệ này.

Anthropic cho biết các phiên bản Claude Opus sắp ra mắt sẽ bao gồm các biện pháp bảo vệ để phát hiện và chặn các kết quả an ninh mạng nguy hiểm, đồng thời có kế hoạch giới thiệu Chương trình Xác minh An ninh mạng dành cho các chuyên gia an ninh đã được kiểm định. Một báo cáo công khai về kết quả của các đối tác và các lỗ hổng đã được vá dự kiến sẽ được công bố trong vòng 90 ngày.