Obsługiwane przez
News

„Magnetyczny Rynek” firmy Microsoft ujawnia, jak agenci AI mogą załamać się pod presją

Microsoft Research, wraz z Uniwersytetem Stanowym w Arizonie, niedawno uruchomiło śmiałe eksperyment, zwany Magentic Marketplace — cyfrowy plac zabaw, gdzie setki agentów sztucznej inteligencji (AI) rywalizowały, współpracowały i od czasu do czasu oszukiwały się nawzajem w symulowanej gospodarce.

NAPISAŁ
UDOSTĘPNIJ
„Magnetyczny Rynek” firmy Microsoft ujawnia, jak agenci AI mogą załamać się pod presją

‘Magentic Marketplace’ pokazuje, że boty AI mają problemy z oszustwami i przeciążeniem

Projekt Microsoftu został stworzony, aby przetestować, jak autonomiczne systemy AI zachowują się na złożonych rynkach — a wyniki były dalekie od wzmagających zaufanie. Opublikowana na otwartych zasadach symulacja, dostępna na Github, postawiła 100 botów „klientów” przeciw 300 botom „biznesowym”, odzwierciedlając rzeczywisty handel.

Agenty kupujące podążały za naturalnymi wskazówkami jak „zamów obiad”, podczas gdy agenty biznesowe korzystały z negocjacji, perswazji, a nawet oszustwa, aby zdobyć transakcję. Każdy agent AI był zasilany nowoczesnymi modelami, w tym OpenAI’s GPT-4o i GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b oraz open-source GPTOSS-20b.

Jednak podczas testów te modele spektakularnie się potknęły. Stając przed zbyt wieloma wyborami — czasami 100 lub więcej — ich „przestrzeń uwagi” się załamała. Ece Kamar z Microsoftu zauważyła, że obecne modele były naprawdę przytłoczone posiadaniem zbyt wielu opcji. To doprowadziło do „efektu pierwszej propozycji”, gdzie boty kurczowo trzymały się pierwszej oferty, którą zobaczyły, dając szybciej reagującym sprzedawcom przewagę 10-30x i obniżając ogólny wynik dobrobytu rynku.

Jeszcze bardziej niepokojąca była łatwowierność agentów. Niektórzy „sprzedawcy” oszukali kupujących za pomocą fałszywych referencji i manipulacji instrukcji, przekierowując wszystkie płatności na siebie. GPT-4o i GPTOSS-20b zostały całkowicie oszukane, Qwen3-4b nabrał się na tanią perswazję, a jedynie Anthropic’s Claude Sonnet 4 wytrzymał presję. W jednym symulowanym rynku wszyscy kupujący stracili swoje wirtualne fundusze na rzecz oszukańczych sprzedawców.

Kiedy w grę weszła współpraca, sytuacja się nie poprawiła. Bez ludzkiego przewodnictwa agenty nie potrafiły skutecznie współpracować ani przypisać ról, co generowało chaos na rynku. Dopiero gdy badacze szczegółowo ich instruowali, chaos ustępował — wyraźna oznaka, że te modele nie są wrodzenie gotowe do współpracy, przynajmniej na razie.

Microsoft stwierdził, że choć agenty AI mają potencjał jako asystenci, nadal są nieodpowiednie do niesuperwizyjnego wdrażania w rzeczywistym świecie. Symulacja pokazała, że pozostawione same sobie, cyfrowe agenty mogą szybciej zniszczyć gospodarkę, niż ją zbudować.

Dla tych odważnych, którzy chcą zajrzeć pod maskę, Magentic Marketplace pozostaje open-source na Github i Azure AI Foundry Labs — piaskownicą do badania, jak bardzo nieporządne mogą stać się autonomiczne rynki, zanim wybuchną.

FAQ ❓

  • Czym jest Microsoft’s Magentic Marketplace?
    Symulowana cyfrowa gospodarka stworzona przez Microsoft Research do testowania, jak agenty AI zachowują się w konkurencyjnych i współpracujących środowiskach rynkowych.
  • Kto uczestniczył w tworzeniu Magentic Marketplace?
    Microsoft Research współpracował z Uniwersytetem Stanowym w Arizonie, aby zbudować i zbadać eksperyment.
  • Jakie modele AI zostały przetestowane w eksperymencie?
    Agenty były zasilane przez modele takie jak OpenAI’s GPT-4o i GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, GPTOSS-20b i Anthropic’s Claude Sonnet 4.
  • Gdzie badacze mogą uzyskać dostęp do platformy Magentic Marketplace?
    Symulacja open-source jest dostępna na GitHub i Azure AI Foundry Labs.