ارائه توسط
Featured

جنگ مرورگرهای AI: عوامل جدید، تب‌ها را به استادان وظیفه تبدیل می‌کنند

یک موج جدید از رقابت مرورگرهای هوش مصنوعی در حال تبدیل مرورگر از یک پنجره منفعل به یک همیار فعال برای انجام وظایف است.

نویسنده
اشتراک
جنگ مرورگرهای AI: عوامل جدید، تب‌ها را به استادان وظیفه تبدیل می‌کنند

چه چیزی باعث افزایش مرورگرهای هوش مصنوعی شده است؟

OpenAI، Perplexity، Anthropic، و The Browser Company از جمله نام‌های برجسته گروهی هستند که ویژگی‌های عامل‌محور مانند خلاصه‌سازی، برنامه‌ریزی و فشار دکمه‌ها به نمایندگی از شما را با سرعتی که از اواخر دهه ۹۰ در نبردهای مرورگر دیده نشده است، ارائه می‌دهند.

اطلس OpenAI در تاریخ ۲۱ اکتبر ۲۰۲۵ با یکپارچه‌سازی عمیق ChatGPT منتشر شد؛ Comet از Perplexity در ژوئیه وارد شد؛ و The Browser Company به Dia در اواسط سال تغییر مسیر داد تا بر یک تجربه “بومی هوش مصنوعی” تأکید کند.

نبرد مرورگرهای هوش مصنوعی: عوامل جدید زبانه‌ها را به فرماندهان تبدیل می‌کنند
ChatGPT Atlas.

فهرست ویژگی‌ها بیشتر شبیه منوهای یک دربان است تا افزونه‌های نوار ابزار قدیمی. اطلس به هدف قرار دادن جستجوها، خلاصه‌سازی صفحات و خودکارسازی‌هایی مانند خرید یا برنامه‌ریزی سفر می‌پردازد. Comet از Perplexity به پاسخ‌های بلادرنگ و تحقیق از منابع متعدد با گزینه‌هایی برای پردازش محلی توجه دارد. Dia جستجوی مکالمه‌ای و خودکارسازی جریان کار را بر روی مرور آشنا قرار می‌دهد.

استارتاپ‌ها در حال ورود هستند. Strawberry مستقر در استکهلم “همراهان”ی را ارائه می‌دهد که اسکرول، کلیک و تایپ می‌کنند و کارهای طولانی‌مدتی مانند تولید سرنخ را انجام می‌دهند—اعتباری اندازه‌گیری شده و توسط تاییدات کاربر محدود شده است. برنامه دسکتاپ Claude از Anthropic “استفاده از کامپیوتر” را اضافه می‌کند که می‌تواند دسکتاپ‌ها و مرورگرها را هدایت کند و خط بین عامل و مرورگر را محو کند حتی زمانی که ابزار یک مرورگر کامل نیست.

نبرد مرورگرهای هوش مصنوعی: عوامل جدید زبانه‌ها را به فرماندهان تبدیل می‌کنند
مرورگر Strawberry.

سپس BrowserOS وجود دارد، یک استارتاپ حمایت‌شده از Y Combinator (دسته YC S24) که در حال ساخت یک مرورگر متن‌باز با تمرکز بر حریم خصوصی برای نسل هوش مصنوعی است. “BrowserOS یک جایگزین متن‌باز و اولویت‌دار برای ChatGPT Atlas و Perplexity Comet است”، Y Combinator این هفته نوشته است.

شرکت پیشرو شتاب‌دهنده استارتاپی اضافه کرده است:

“بدون قفل شدن تامین‌کننده: از هر LLM یا موتور جستجوی عامل‌های هوش مصنوعی که به صورت محلی اجرا می‌شوند، استفاده کنید. بدون ردیابی شما برای تبلیغات یا جمع‌آوری داده‌ها. در دسترس برای Mac/Win/Linux.”

M&A در حال تسریع این تغییر است. در ۲۳ اکتبر ۲۰۲۵، OpenAI اعلام کرد که Software Applications Incorporated (SAI)، تولیدکننده Sky، یک رابط کاربری مک با زبان طبیعی که توسط فارغ‌التحصیلان Apple Workflow سابق تأسیس شده است را خریداری می‌کند. این معامله می‌خواهد اطلس را با کنترل دسکتاپ نزدیک‌تر روی سخت‌افزار اپل تغذیه کند.

نبرد مرورگرهای هوش مصنوعی: عوامل جدید زبانه‌ها را به فرماندهان تبدیل می‌کنند
Comet از Perplexity.

زیر ساخت این محصولات، مدل‌های زبان بزرگ را با کنترل رابط گرافیکی و تماس‌های API هدف‌دار ادغام می‌کنند. معیارهایی که توسط سازندگان ذکر شده‌اند نشان‌دهنده نرخ‌های موفقیت بالای ۹۰ درصد در آزمون‌های پیمایش عامل‌محور مانند Webvoyager هستند و سرعت تکمیل کار را تقریباً سه برابر سریع‌تر از جریان کارهای سنتی کلیک و تایپ گزارش می‌دهند.

این داستان عملکرد دارای پیامدهای محصول است. طراحی‌های ترکیبی—استفاده از APIها در جایی که ممکن است و استفاده از پیمایش صفحه زمانی که لازم است—تعادل بین اطمینان و بُرد را برقرار می‌کنند و می‌توانند موفقیت انجام کارها را به میزان دو رقمی بهبود بخشند.

نبرد مرورگرهای هوش مصنوعی: عوامل جدید زبانه‌ها را به فرماندهان تبدیل می‌کنند
Dia از شرکت مرورگر.

حریم خصوصی و عملکرد تمایزدهنده هستند. Comet گزینه‌های پردازش محلی را تأکید می‌کند؛ Leo از Brave تعاملات ناشناس و تحلیل‌های در صفحه‌ای را پیشنهاد می‌دهد؛ Aria از Opera دسترسی به وب در زمان واقعی و در سال ۲۰۲۵ حالت “اپراتور مرورگر” برای خودکارسازی وظایف زبانه را اضافه می‌کند. این پیشگامان به صورت کامل عامل نیستند، اما سریعتر در حال ادغام هوش مصنوعی در مرور روزانه هستند.

سفر کاربر از جستجو → پاسخ → عمل در حال مسطح شدن است. واگذاری از طریق زبان انگلیسی ساده بسیاری از مراحل سنتی را دور می‌زند و عوامل می‌توانند وظایف را در زبانه‌ها به صورت موازی انجام دهند. این می‌تواند نحوه کشف محتوا توسط افراد و نحوه کسب توجه توسط سایت‌ها را تغییر دهد، که SEO را به سمت چیزی که اکنون بسیاری به آن GEO (بهینه‌سازی موتور تولیدی) می‌نامند، تغییر می‌دهد.

نبرد مرورگرهای هوش مصنوعی: عوامل جدید زبانه‌ها را به فرماندهان تبدیل می‌کنند
Leo از Brave.

برای کاربران، طرحی ساده است: کمتر دست‌وپاگیری، بیشتر انجام دادن. عوامل پیش نویس، مقایسه، رزرو و خلاصه می‌کنند؛ کاربران بررسی و تأیید می‌کنند. پیروزی‌های عملی در روندهای تحقیق، خریدهای آنلاین و مرتب‌سازی دسکتاپ نشان می‌دهد—مخصوصاً اگر تکنولوژی Sky اجازه دهد که اطلس به فرمان در macOS کلیک کند.

برای شرکت‌ها، رقابت استراتژیک وجود دارد. خریدهای OpenAI (از جمله SAI) استعداد‌های رابط کاربری را متمرکز می‌کند؛ گوگل در حال توسعه عوامل خود است؛ استارتاپ‌ها به دنبال حوزه‌هایی هستند که دارای قابلیت‌های خصوصی یا جریان‌های کاری عمودی باشند. مرکز ثقل از “کمک در حین مرور” به “مرور در حین کمک” در حال حرکت است.

گوگل، Opera و Brave تحول به محور اصلی را نشان می‌دهند. Aria بر روی دسکتاپ و موبایل با پاسخ‌های در زمان واقعی، ابزارهای ایجاد محتوا و خودکارسازی‌های ابتدایی، از جمله بهینه‌سازی برای دستگاه‌های با مشخصات پایین تمرکز دارد. تمرکز Leo از Brave بر تحلیل خصوصی، استناد به منابع صفحه‌ای با گزینه‌هایی برای ارسال بین مدل‌ها و ذخیره تاریخچه محلی است. فلسفه‌های مختلف، همان مسیر.

اما همانطور که مرورگرهای هوش مصنوعی به عوامل کامل تبدیل می‌شوند، سطوح حمله جدیدی نیز را باز می‌کنند. این هفته گذشته، Bitcoin.com News گزارش کرده است که چگونه محققان امنیتی هشدار می‌دهند که راهنمایی‌های مخفی وب—به اصطلاح تزریقات پنهان یا غیرمستقیم—می‌توانند عوامل OpenAI، Perplexity و Anthropic را به جعل دستورات مخرب یا افشای اطلاعات حساب‌های متصل‌کننده فریب دهند.

کارشناسان توصیه می‌کنند تا محدودیت‌های دسترسی شدید و استفاده از sandboxing اعمال شود تا زمانی که حفاظت‌های قوی‌تری در این ابزارهای بومی هوش مصنوعی ایجاد شود. تا سال ۲۰۲۷، سازندگان انتظار دارند عوامل چند ‌پلتفرمی بیشتر شبیه به سیستم‌عامل‌های سبک برای وب باز عمل کنند—مدیریت تحقیقات، معاملات و کارهای متقاطع اپلیکیشن—در حالی که سوالات جدیدی درباره اعتباربخشی، محدودیت‌های API و محافظ‌ها را مطرح می‌کنند.

نتیجه‌گیری: نوار آدرس در حال تبدیل شدن به یک خط فرمان برای زندگی روزمره است. اگر دهه ۹۰ درباره برنده شدن پنجره بود، سال ۲۰۲۵ درباره مالکیت جریان کار است. مرورگر فقط جایی نیست که شما وب را می‌خوانید؛ این جایی است که وب شروع به انجام کارها برای شما می‌کند.

FAQ 🤖

  • نبردهای “مرورگرهای هوش مصنوعی” چیست؟ رقابتی در سال ۲۰۲۵ بین مرورگرهای بومی هوش مصنوعی و تقویت‌شده با هوش مصنوعی برای ارائه کمک به سبک عامل در داخل مرورگر.
  • کدام محصولات پیشتاز هستند؟ اطلس از OpenAI، Comet از Perplexity، Dia از شرکت مرورگر، به اضافه ابزارهای عامل‌محور مانند استفاده از کامپیوتر Claude.
  • چرا این موضوع برای کاربران اهمیت دارد؟ عوامل تحقیق و وظایف روتین را به جریان کار سریع‌تر و براساس تأیید کاربران با خلاصه‌ها و اقدامات داخلی متراکم می‌کنند.
  • چه اتفاقی بعدی رخ می‌دهد؟ کنترل عمیق‌تر دسکتاپ، عوامل ترکیبی API/GUI و گزینه‌های گسترده‌تر حریم خصوصی همگام با رقابت شرکت‌ها به سمت دستیارهای چندکاره تا سال ۲۰۲۷.
برچسب‌ها در این داستان