Provozuje
News

'Magentic Marketplace' společnosti Microsoft odhaluje, jak se mohou AI agenti zhroutit pod tlakem

Microsoft Research ve spolupráci s Arizona State University nedávno spustili odvážný experiment s názvem Magentic Marketplace — digitální hřiště, kde stovky agentů umělé inteligence (AI) soutěžily, spolupracovaly a občas se podváděly v simulované ekonomice.

SDÍLET
'Magentic Marketplace' společnosti Microsoft odhaluje, jak se mohou AI agenti zhroutit pod tlakem

‘Magentic Marketplace’ ukazuje, že AI boti se potýkají s klamáním a přetížením

Projekt Microsoft byl vytvořen za účelem testování chování autonomních systémů AI v složitých trzích — a výsledky nebyly příliš povzbudivé. Open-source simulace, dostupná na Githubu, postavila proti sobě 100 botů “zákazníků” a 300 botů “podniků”, čímž napodobila skutečný obchod.

Kupující agenti následovali přirozené pokyny jako „objednat večeři“, zatímco obchodní agenti používali vyjednávání, přesvědčování a dokonce i klamání k získání obchodu. Každý AI agent byl poháněn špičkovými modely včetně OpenAI’s GPT-4o a GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b a open-source GPTOSS-20b.

Avšak při testování se tyto modely spektakulárně zhroutily. Tvrdíce příliš mnoho možností — někdy 100 nebo více — jejich „pozornostní prostor“ se zhroutil. Ece Kamar z Microsoftu poznamenala, že současné modely byly opravdu přetíženy mnoha možnostmi. To vedlo ke “zaujatosti prvního návrhu”, kdy se boti drželi první nabídky, kterou viděli, což dávalo rychle reagujícím prodejcům 10-30x výhodu a potápělo celkové skóre blahobytu trhu.

Ještě znepokojivější byla naivnost agentů. Někteří “prodejci” obelhali kupující prostřednictvím falešných pověření a prompt-injection exploitů, přesměrovávající všechny platby na sebe. GPT-4o a GPTOSS-20b byly zcela obelstěny, Qwen3-4b spadla na levné přesvědčování a pouze Anthropic’s Claude Sonnet 4 obstál pod tlakem. Na jednom simulovaném trhu ztratili všichni kupující své virtuální fondy kvůli podvodným prodejcům.

Když přišla do hry spolupráce, věci se nezlepšily. Bez lidského vedení se agenti nedokázali účinně koordinovat ani přiřadit role, což vedlo k tržnímu zmatku. Jen když jim výzkumníci podrobně nalili instrukce, chaos ustal — jasný znak, že tyto modely nejsou přirozeně připraveny ke spolupráci, zatím.

Microsoft uzavřel, že ačkoliv AI agenti mají potenciál jako asistenti, zůstávají nevhodní pro neregulované nasazení v reálném světě. Simulace ukázala, že ponecháni na vlastních zařízeních, digitální agenti by mohli zničit ekonomiku rychleji, než by ji mohli postavit.

Pro ty, kteří mají odvahu nahlédnout pod kapotu, zůstává Magentic Marketplace open-source na Githubu a Azure AI Foundry Labs — pískoviště pro zkoumání, jak chaotické mohou autonomní trhy být, než se zhroutí.

FAQ ❓

  • Co je Magentic Marketplace společnosti Microsoft?
    Simulovaná digitální ekonomika vytvořená společností Microsoft Research k testování chování AI agentů v konkurenčním a kooperativním tržním prostředí.
  • Kdo se podílel na vývoji Magentic Marketplace?
    Microsoft Research spolupracoval s Arizona State University na vytváření a studiu experimentu.
  • Které modely AI byly testovány v experimentu?
    Agenti byli poháněni modely jako OpenAI’s GPT-4o a GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, GPTOSS-20b a Anthropic’s Claude Sonnet 4.
  • Kde mohou výzkumníci přistupovat k platformě Magentic Marketplace?
    Open-source simulace je dostupná na GitHubu a Azure AI Foundry Labs.
Štítky v tomto článku