Pokreće
News

Microsoftov 'Magnetic Marketplace' otkriva kako AI agenti mogu podleći pritisku

Microsoft Research, zajedno s Arizona State University, nedavno je pokrenuo hrabar eksperiment nazvan Magentic Marketplace — digitalno igralište gdje su se stotine agenata umjetne inteligencije (AI) natjecale, surađivale, i povremeno varale jedni druge u simuliranom gospodarstvu.

PODIJELI
Microsoftov 'Magnetic Marketplace' otkriva kako AI agenti mogu podleći pritisku

‘Magentic Marketplace’ pokazuje da AI botovi imaju problema s obmanom i preopterećenjem

Microsoft projekt izgrađen je kako bi testirao kako se autonomni AI sustavi ponašaju u složenim tržištima — i nalazi nisu bili nimalo ohrabrujući. Simulacija otvorenog koda, dostupna na Githubu, suprotstavila je 100 “kupaca” botova protiv 300 “poslovnih” botova, odražavajući stvarnu trgovinu.

Kupci su slijedili prirodne upite poput “naruči večeru”, dok su poslovni agenti koristili pregovaranje, uvjeravanje, pa čak i obmanu kako bi dobili posao. Svaki AI agent bio je pokretan najnovijim modelima uključujući OpenAI’s GPT-4o i GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, i open-source GPTOSS-20b.

Ipak, kad su testirani, ovi modeli su spektakularno zakazali. Suočeni s previše izbora — ponekad 100 ili više — njihov “prostor pažnje” se urušio. Microsoftova Ece Kamar je primijetila da su trenutni modeli bili stvarno preopterećeni s previše opcija. To je dovelo do “pristranosti prvih ponuda”, gdje su se botovi držali prve ponude koju su vidjeli, dajući brže reagirajućim prodavačima prednost od 10-30x i uništavajući ukupni bodovni rezultat tržišta u pogledu blagostanja.

Još više zabrinjavajuća bila je lakovjernost agenata. Neki “prodavači” prevarili su kupce lažnim vjerodajnicama i prompt-injection napadima, preusmjeravajući sve uplate sebi. GPT-4o i GPTOSS-20b su potpuno bili prevareni, Qwen3-4b nasjeo je na jeftina uvjeravanja, a jedino je Anthropic’s Claude Sonnet 4 izdržao pod pritiskom. U jednom simuliranom tržištu, svi kupci su izgubili svoja virtualna sredstva zbog lažnih prodavača.

Kad je suradnja ušla u igru, stvari se nisu poboljšale. Bez ljudskog vodstva, agenti nisu uspjeli koordinirati ili učinkovito dodijeliti uloge, generirajući konfuziju širom tržišta. Tek kad su im istraživači pažljivo dali detaljne upute, kaos se smirio — što je jasan znak da ovi modeli još nisu prirodno spremni za suradnju.

Microsoft je zaključio da iako AI agenti imaju potencijal kao asistenti, ostaju neprikladni za nesupervizirano stvarno korištenje. Simulacija je pokazala da prepušteni sami sebi, digitalni agenti mogu uništiti gospodarstvo brže nego ga izgraditi.

Za one dovoljno hrabre da zavire ispod haube, Magentic Marketplace ostaje open-source na Githubu i Azure AI Foundry Labs — laboratorij za istraživanje koliko autonomna tržišta mogu postati neuredna prije nego što implodiraju.

FAQ ❓

  • Što je Microsoftov Magentic Marketplace?
    Simulirano digitalno gospodarstvo koje je Microsoft Research izgradio kako bi testirao kako se AI agenti ponašaju u konkurentnim i kooperativnim tržišnim okruženjima.
  • Tko je sudjelovao u razvoju Magentic Marketplacea?
    Microsoft Research surađivao je s Arizona State University kako bi izgradili i proučili eksperiment.
  • Koji AI modeli su testirani u eksperimentu?
    Agenti su bili pokretani modelima poput OpenAI’s GPT-4o i GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, GPTOSS-20b, i Anthropic’s Claude Sonnet 4.
  • Gdje istraživači mogu pristupiti platformi Magentic Marketplace?
    Simulacija otvorenog koda dostupna je na GitHubu i Azure AI Foundry Labs.