Működteti
Featured

AI Böngészőháborúk: Új Ügynökök Alakítják a Füleket Feladattáblákká

Az AI böngészőháborúk új hulláma átalakítja a böngészőt egy passzív ablakból egy aktív, feladatokat teljesítő segéddé.

MEGOSZTÁS
AI Böngészőháborúk: Új Ügynökök Alakítják a Füleket Feladattáblákká

Mi hajtja az AI böngészőbuborékot?

OpenAI, Perplexity, Anthropic és a The Browser Company vezeti azt a csoportot, amely ügynöki funkciókat vezet be – gondoljunk a feladatok összefoglalására, tervezésére és gombnyomások végrehajtására -, olyan ütemben, amit az 1990-es évek végén, a böngészőháborúk óta nem láttunk.

Az OpenAI Atlas 2025. október 21-én érkezett mély ChatGPT integrációval; a Perplexity Comet júliusban landolt; és a The Browser Company az év közepén Dia-ra váltott, hogy hangsúlyozza az “AI-native” élményt.

AI Browser Wars: New Agents Turn Tabs Into Taskmasters
ChatGPT Atlas.

Az új funkciólisták kevesebb régi stílusú eszköztárt és több concierge-menüt kínálnak. Az Atlas célja a lekérdezések, oldalösszefoglalók és olyan automatizmusok, mint a vásárlás vagy az utazásszervezés. A Perplexity Comet a valós idejű válaszokra és a több forrásból származó kutatásra koncentrál, helyi feldolgozási lehetőséggel. A Dia beszélgetésalapú keresési és munkafolyamat-automatizálást kínál a jól ismert böngészés fölé.

A startupok özönlenek be. A stockholmi Strawberry olyan “társakat” szállít, amelyek gördítenek, kattintanak és írnak a hosszú távú feladatok, mint például a lead generálás során – hitelkártyával mérők és felhasználói jóváhagyások által korlátozva. Az Anthropic Claude asztali alkalmazása “számítógép használat” funkciót kínál, amely irányíthatja az asztali környezeteket és a böngészőket, még akkor is, ha az eszköz nem teljes böngésző.

AI Browser Wars: New Agents Turn Tabs Into Taskmasters
Strawberry böngésző.

A BrowserOS, egy Y Combinator által támogatott startup (YC S24 batch), amely egy nyílt forráskódú, adatvédelem-orientált böngészőt épít, amely kifejezetten az AI generáció számára készült. “A BrowserOS egy nyílt forráskódú, adatvédelem fókuszú alternatíva a ChatGPT Atlas és a Perplexity Comet számára,” írta a Y Combinator ezen a héten az X-en.

A vezető startup gyorsító cég hozzátette:

“Nincs gyártói zár: használjon bármilyen LLM-et vagy keresőmotor AI ügynökökkel működjön helyben. Nincs követés hirdetések vagy adatgyűjtés céljából. Elérhető Mac/Win/Linux rendszerhez.”

Az M&A gyorsítja az átalakulást. 2025. október 23-án az OpenAI bejelentette, hogy felvásárolja a Software Applications Incorporated (SAI) vállalatot, a Sky nevű, természetes nyelvű Mac interfész létrehozóját, amelyet az ex-Apple Workflow (Shortcuts) alkalmazottai alapítottak. Az üzlet célja, hogy szorosabb asztali vezérlést biztosítson az Atlas számára az Apple hardveren.

AI Browser Wars: New Agents Turn Tabs Into Taskmasters
Perplexity Comet.

A motorháztető alatt ezek a termékek nagy nyelvi modelleket egyesítenek GUI vezérléssel és célzott API hívásokkal. Az építők által hivatkozott próbák sikerességi aránya meghaladja a 90%-ot az ügynöki navigációs tesztek, például a Webvoyager esetében, és a feladatok elvégzési sebességét körülbelül háromszor gyorsabbnak mutatják, mint a hagyományos kattintás-írás munkafolyamatok.

Ez a teljesítménytörténet termékimpulzusokat tartalmaz. A hibrid tervezés – az API-k használata, ahol lehetséges, és szükség esetén visszanyúlva a képernyőn történő navigációhoz – egyensúlyba hozza a megbízhatóságot az eléréssel, és képes megduplázni a feladat sikerességét.

AI Browser Wars: New Agents Turn Tabs Into Taskmasters
A Browser Company Dia.

Az adatvédelem és a teljesítmény megkülönböztetők. A Comet hangsúlyozza a helyi feldolgozási lehetőségeket; a Brave’s Leo névtelen parancsokat és az oldalon belüli elemzést kínál; az Opera’s Aria valós idejű webhozzáférést kínál, és 2025-ben bevezeti a “Böngésző Operátor” módot a lapfeladatok automatizálására. Ezek az incumbens vállalatok nem teljesen ügynöki jellegűek, de gyorsan beépítik az AI-t a mindennapi böngészésbe.

A felhasználói élmény laposodik a lekérdezés → válasz → cselekvés irányába. Az egyszerű angol nyelvű küldetés sok hagyományos lépést kihagy, és az ügynökök párhuzamosan kezelhetik a feladatokat a füleken. Ez megváltoztathatja, hogyan fedezik fel az emberek a tartalmat, és hogyan szereznek figyelmet a weboldalak, áthelyezve az SEO-t arra, amit ma sokan GEO-nak (Generative Engine Optimization) neveznek.

AI Browser Wars: New Agents Turn Tabs Into Taskmasters
Brave’s Leo.

A felhasználók számára az ajánlat egyszerű: kevesebb babrálás, több befejezés. Az ügynökök vázlatokat készítenek, összehasonlítanak, foglalnak és összefoglalnak; a felhasználók felülvizsgálják és jóváhagyják. A gyakorlati nyereségek a kutatási munkafolyamatokban, a vásárlási kasszáknál és az asztali rendezés során jelennek meg – különösen, ha a Sky technológiája lehetővé teszi az Atlas számára, hogy macOS rendszeren kattintsanak parancsra.

A vállalatok számára stratégiai versengés zajlik. Az OpenAI felvásárlásai (beleértve az SAI-t is) konszolidálják az interfész tehetséget; a Google fejleszti saját ügynökeit; a startupok függőleges munkafolyamatokkal vagy adatvédelem célú megoldásokkal próbálnak rést találni. A gravitációs központ az “asszisztálás miközben böngészel” álláspontról a “böngészés miközben asszisztálsz” irányába tolódik el.

A Google, az Opera és a Brave példázza a főáramú váltást. Aria az asztali és a mobil eszközökön is nyújt valós idejű válaszokat, tartalomkészítő eszközöket és alapvető automatizációt, beleértve az alacsonyabb specifikációjú eszközökhöz való optimalizálást. A Brave’s Leo a privát, forrásmegjelenítős, oldalon történő elemzésre koncentrál, lehetőségekkel a modellek közötti átkapcsolásra és a történet lokális tárolására. Különböző filozófiák, ugyanazon irány.

Azonban ahogy az AI böngészők teljes ügynökké fejlődnek, új támadási felületeket is megnyitnak. Az elmúlt héten a Bitcoin.com News beszámolt, hogyan figyelmeztetnek a biztonsági kutatók arra, hogy a rejtett webi felhívások – ún. rejtett vagy közvetett prompt-injekciók – eltéríthetik az OpenAI, a Perplexity és az Anthropic ügynökeit, megtévesztve őket rosszindulatú parancsok végrehajtásában vagy kapcsolódó fiókok adatok kiszivárogtatásában.

A szakértők szigorú engedélyezési korlátokat és szigetelést javasolnak, amíg erősebb védelmi intézkedések nem lépnek érvénybe ezeknél a feltörekvő AI-native eszközöknél. 2027-re az építők azt várják, hogy a multiplatformos ügynökök inkább könnyű operációs rendszerekhez hasonlatosan működjenek az open weben – kezelve a kutatásokat, tranzakciókat és a kereszt-alkalmazás feladatokat -, miközben új kérdéseket vetnek fel az attribution, az API korlátok és a korlátok tekintetében.

A tanulság: a címsor egy parancssorrá válik a mindennapi élet számára. Ha a ’90-es évek az ablakok megnyeréséről szóltak, akkor 2025 az a munkafolyamat birtoklásáról. A böngésző nem csak az, ahol a webet olvassuk; az az, ahol a web elkezd dolgokat tenni érted.

GYIK 🤖

  • Mik azok az “AI böngészőháborúk”? 2025-ös verseny az AI-native és AI-fejlesztett böngészők között, hogy ügynök stílusú segítséget nyújtsanak a böngészőben.
  • Mely termékek vezetnek? Az OpenAI Atlas, a Perplexity Comet, a The Browser Company Dia, valamint az ügynöki eszközök, mint például a Claude számítógép használata.
  • Miért fontos ez a felhasználók számára? Az ügynökök a kutatásokat és a rutinfeladatokat gyorsabb, jóváhagyás-alapú munkafolyamatokká sűrítik be, beépített összefoglalókkal és műveletekkel.
  • Mi jön ezután? Mélyebb asztali vezérlés, hibrid API/GUI ügynökök, és szélesebb adatvédelmi lehetőségek, ahogy a vállalatok 2027-es multitool asszisztens irányába sietnek.
Címkék ebben a cikkben