Được cung cấp bởi
Featured

Cuộc Chiến Trình Duyệt AI: Các Tác Nhân Mới Biến Tab Thành Những Người Chủ Nhiệm Vụ

Một làn sóng mới của cuộc chiến trình duyệt AI đang biến đổi trình duyệt từ một cửa sổ thụ động thành một trợ lý chủ động, làm công việc.

TÁC GIẢ
CHIA SẺ
Cuộc Chiến Trình Duyệt AI: Các Tác Nhân Mới Biến Tab Thành Những Người Chủ Nhiệm Vụ

Điều gì đang thúc đẩy sự bùng nổ trình duyệt AI?

OpenAI, Perplexity, Anthropic, và The Browser Company đang tiên phong thúc đẩy các tính năng agentic—hãy nghĩ đến việc tóm tắt, lập kế hoạch và nhấn nút thay bạn—với tốc độ chưa từng thấy kể từ cuộc chiến trình duyệt cuối những năm 90.

OpenAI’s Atlas đã ra mắt vào ngày 21 tháng 10 năm 2025, với sự tích hợp sâu ChatGPT; Comet của Perplexity đã xuất hiện vào tháng 7; và The Browser Company đã chuyển hướng sang Dia giữa năm để nhấn mạnh trải nghiệm “AI gốc”.

Cuộc chiến trình duyệt AI: Các đại lý mới biến tab thành chủ nhân công việc
ChatGPT Atlas.

Danh sách tính năng không còn giống như các tiện ích thanh công cụ của trường cũ mà giống như các menu hướng dẫn hơn. Atlas nhắm vào truy vấn, tóm tắt trang, và tự động hóa như mua sắm hoặc lập kế hoạch du lịch. Perplexity‘s Comet hướng đến câu trả lời thời gian thực và nghiên cứu đa nguồn với các tùy chọn xử lý địa phương. Dia phủ lớp tìm kiếm đối thoại và tự động hóa quy trình làm việc lên trình duyệt quen thuộc.

Các công ty khởi nghiệp đang chen chúc vào. Công ty có trụ sở tại Stockholm, Strawberry, cung cấp “người bạn đồng hành” để cuộn, nhấp và gõ qua những công việc dài hạn như tạo khách hàng tiềm năng—đo tín dụng và kiểm soát bởi sự chấp thuận của người dùng. Ứng dụng máy tính Claude của Anthropic bổ sung “sử dụng máy tính” có thể lái máy tính và trình duyệt, làm mờ ranh giới giữa đại lý và trình duyệt ngay cả khi công cụ không phải là một trình duyệt hoàn chỉnh.

Cuộc chiến trình duyệt AI: Các đại lý mới biến tab thành chủ nhân công việc
Trình duyệt Strawberry.

Sau đó là BrowserOS, một công ty khởi nghiệp được Y Combinator hỗ trợ (yêu cầu YC S24) đang xây dựng một trình duyệt mã nguồn mở, ưu tiên bảo mật được chế tạo riêng cho thế hệ AI. “BrowserOS là một lựa chọn mã nguồn mở, ưu tiên bảo mật thay thế cho ChatGPT Atlas & Perplexity Comet,” Y Combinator đã viết trên X tuần này.

Công ty dẫn đầu trong tăng tốc khởi nghiệp đã thêm:

“Không khóa vendor: sử dụng bất kỳ LLM hoặc đại lý AI công cụ tìm kiếm nào chạy cục bộ. Không theo dõi bạn để quảng cáo hoặc thu thập dữ liệu. Có sẵn cho Mac/Win/Linux.”

M&A đang tăng tốc sự chuyển đổi này. Vào ngày 23 tháng 10 năm 2025, OpenAI cho biết họ sẽ mua lại Software Applications Incorporated (SAI), nhà sản xuất Sky, một giao diện ngôn ngữ tự nhiên cho Mac được sáng lập bởi cựu thành viên của Apple Workflow (Shortcuts). Thỏa thuận này dự kiến sẽ cung cấp cho Atlas khả năng kiểm soát máy tính tốt hơn trên phần cứng của Apple.

Cuộc chiến trình duyệt AI: Các đại lý mới biến tab thành chủ nhân công việc
Perplexity Comet.

Dưới nắp kính, các sản phẩm này kết hợp mô hình ngôn ngữ lớn với giao diện điều khiển và các cuộc gọi API mục tiêu. Các chỉ số được trích dẫn bởi các nhà sản xuất chỉ ra rằng tỷ lệ thành công trên 90% trong các thử nghiệm điều hướng agentic như Webvoyager và báo cáo tốc độ hoàn thành nhiệm vụ nhanh hơn khoảng ba lần so với các quy trình truyền thống.

Câu chuyện về hiệu suất đó có ý nghĩa sản phẩm. Các thiết kế kết hợp—sử dụng API nếu có thể và quay lại điều hướng trên màn hình khi cần thiết—cân bằng độ tin cậy với phạm vi và có thể cải thiện thành công nhiệm vụ bằng cách tăng phần trăm hai chữ số.

Cuộc chiến trình duyệt AI: Các đại lý mới biến tab thành chủ nhân công việc
Công ty Browser’s Dia.

Quyền riêng tư và hiệu suất là những yếu tố khác biệt. Comet nhấn mạnh các tùy chọn xử lý địa phương; Leo của Brave tự hào với các lời nhắc ẩn danh và phân tích trên trang; Aria của Opera bổ sung truy cập web thời gian thực và vào năm 2025, một chế độ “Operator Browser” để tự động hóa các công việc tab. Những thành viên cũ này chưa hoàn toàn agentic, nhưng họ đang tiến nhanh hơn để nhúng AI vào trình duyệt hàng ngày.

Hành trình người dùng đang bị làm phẳng từ truy vấn → câu trả lời → hành động. Sự ủy quyền qua tiếng Anh đơn giản bỏ qua nhiều bước truyền thống, và các đại lý có thể thực hiện song song các nhiệm vụ qua các tab. Điều đó có thể thay đổi cách mọi người khám phá nội dung và cách các trang web nhận được sự chú ý, chuyển hướng SEO sang vào thứ mà nhiều người bây giờ gọi là GEO (Tối ưu hóa Máy tạo sinh).

Cuộc chiến trình duyệt AI: Các đại lý mới biến tab thành chủ nhân công việc
Leo của Brave.

Đối với người dùng, câu chuyện là đơn giản: giảm thao tác, tăng hoàn thành. Các đại lý soạn thảo, so sánh, đặt chỗ, và tóm tắt; người dùng duyệt và phê duyệt. Những lợi ích thực tiễn hiện lên trong các quy trình làm việc nghiên cứu, thanh toán mua sắm, và dọn dẹp desktop—đặc biệt là nếu công nghệ của Sky cho phép Atlas nhấn quanh macOS theo lệnh.

Đối với các công ty, có một sự xáo trộn chiến lược. Các vụ mua lại của OpenAI (bao gồm cả SAI) hợp nhất tài năng giao diện; Google đang phát triển các đại lý riêng; các công ty khởi nghiệp đuổi theo các giải pháp cho các ngách với các cú pháp bảo mật hoặc quy trình làm việc theo ngành dọc. Trung tâm trọng lực đang chuyển từ “hỗ trợ khi bạn duyệt” sang “duyệt khi bạn hỗ trợ”.

Google, Opera, và Brave minh họa sự chuyển hướng chính thống này. Aria kéo dài trên desktop và di động với các câu trả lời thời gian thực, công cụ tạo nội dung, và tự động hóa cơ bản, bao gồm tối ưu hóa cho các thiết bị có cấu hình thấp. Leo của Brave tập trung vào phân tích trên trang bảo mật, trích dẫn nguồn, với các tùy chọn định tuyến giữa các mô hình và lưu lịch sử cục bộ. Những triết lý khác nhau, cùng hướng đi.

Tuy nhiên, khi các trình duyệt AI tiến hóa thành các đại lý đầy đủ chức năng, chúng cũng đang mở ra các bề mặt tấn công mới. Tuần trước, Bitcoin.com News đã báo cáo về cách các nhà nghiên cứu bảo mật cảnh báo rằng các lời nhắc web ẩn—cái gọi là injection lời nhắc gián tiếp hoặc bí mật—có thể chiếm quyền điều khiển các đại lý từ OpenAI, Perplexity, và Anthropic, lừa chúng thực hiện các lệnh xấu hoặc rò rỉ dữ liệu tài khoản kết nối.

Các chuyên gia khuyên nên giới hạn quyền hạn nghiêm ngặt và thực hiện sandbox cho đến khi các biện pháp bảo vệ mạnh hơn được triển khai trên các công cụ AI gốc mới nổi này. Đến năm 2027, các nhà sản xuất dự đoán các đại lý đa nền tảng sẽ hoạt động giống như các hệ điều hành nhẹ cho web mở—xử lý nghiên cứu, giao dịch và các công việc liên ứng dụng—trong khi đặt ra những câu hỏi mới về quyền phân bổ, giới hạn API, và các hàng rào bảo vệ.

Kết luận: thanh địa chỉ đang biến thành một dòng lệnh cho cuộc sống hàng ngày. Nếu những năm 90 là về việc chiến thắng cửa sổ, thì năm 2025 là về việc sở hữu quy trình làm việc. Trình duyệt không chỉ là nơi bạn đọc web; đó là nơi web bắt đầu làm việc cho bạn.

FAQ 🤖

  • “Cuộc chiến trình duyệt AI” là gì? Cuộc thi năm 2025 giữa các trình duyệt AI mạnh và cải tiến AI để cung cấp hỗ trợ kiểu agent bên trong trình duyệt.
  • Những sản phẩm nào đang dẫn đầu? Atlas của OpenAI, Comet của Perplexity, Dia của The Browser Company, và các công cụ agentic như sử dụng máy tính của Claude.
  • Điều này có ý nghĩa gì đối với người dùng? Các đại lý nén các tác vụ nghiên cứu và định kỳ thành các quy trình làm việc nhanh hơn, dựa trên phê duyệt với các bản tóm tắt và hành động tích hợp sẵn.
  • Điều gì sẽ đến tiếp theo? Kiểm soát máy tính để bàn sâu hơn, các đại lý API/GUI kết hợp, và các tùy chọn bảo mật rộng hơn khi các công ty đua đến năm 2027 với các trợ lý đa công cụ mới.
Thẻ trong bài viết này